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Presentación 


El 15 de marzo de 2020 el virus SARS-Cov-2 que produce la 
enfermedad de la COVID-19 tenía ya características de transmisión 
comunitaria en el Ecuador y al igual que en otras partes del mundo y 
siguiendo el recurso del aislamiento utilizado en anteriores pandemias, 
desde el departamento de comunicación de la Universidad Politécnica 
Salesiana, se nos comunicó que debíamos volver a nuestras casas, ais- 
larnos y organizar nuestras clases para que se lleven a cabo de forma 
virtual usando Moodle o Zoom. Así, las clases se convirtieron, de un 
momento a otro, en virtuales y debíamos “adaptar” nuestros hogares 
para que funcionen como aulas. Un gran cambio en nuestras vidas 
aparecía por delante. El confinamiento duró varios meses y durante 
ese tiempo, el Gobierno Nacional decretó el estado de excepción en 
el país, definiendo días y horarios específicos para salir de casa y para 
la movilización vehicular. En general, los desplazamientos se realiza- 
ban solo por cuestiones de abastecimiento y trámites esenciales o de 
emergencia, todo lo demás debía ser recibido, producido y trabajado en 
casa. Pasó a ser muy común que estemos pendientes de cada noticia del 
COE Nacional sobre la expansión del virus y las graves consecuencias 
que traía. Así mismo, pasamos a estar muy pendientes de las noticias, 
las estadísticas y todo lo que sucedía alrededor del mundo. En ese 
contexto empezó a aparecer la idea de, ¿cómo podemos aportar en la 
emergencia? Los militares aportaban, las personas que trabajaban en 
la recolección de desechos aportaban, las personas que trabajaban en 
las cadenas de distribución también aportaban, todos desde su ámbito. 
Pero ¿desde la ingeniería que se podía hacer? Algunas iniciativas se 
conocieron sobre la construcción de respiradores artificiales y otras 
con la construcción de cabinas de desinfección, tanto de coches como 
de personas, lo cual, dentro del contexto que se vivía era gratificante 
ver como las propuestas para solucionar los problemas no venían solo 
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del primer mundo, sino que aparecían en nuestro propio entorno. Una 
de las principales estrategias utilizadas para controlar el virus era la 
detección de casos y los correspondientes cercos epidemiológicos, para 
lo cual era fundamental contar con una prueba de diagnóstico de los 
posibles contagiados. Las pruebas más eficaces eran y son las RT-PCR, 
las cuales llegaron a tener un costo de 120 USD (mínimo) y servían 
principalmente para certificar si se estaba contagiado o no. Dichas 
pruebas empezaron a constituirse incluso en un requisito para poder 
laborar, y aunque a día de hoy, su costo ha disminuido, siguen siendo 
utilizadas como medio de diagnóstico. Esto junto con el hecho de que 
no se sabía a ciencia cierta en qué momento se pasa de un estado posi- 
tivo a uno negativo, llevaba a que los ciudadanos tuvieran, en muchos 
casos, que gastar una buena suma de dinero solo para saber si ya no 
tenían el virus. En ese punto, me empecé a preguntar, ¿será que existe 
algún patrón característico de la COVID-19 que pudiera ser detectado 
telemáticamente y que evite a las personas salir de casa y dejarse una 
gran cantidad de dinero para el diagnóstico de la enfermedad? Por 
mi orientación de estudios, me enfoqué en los patrones acústicos 
que podrían estar relacionados con la enfermedad y luego de revisar 
los síntomas característicos de la COVID-19, apareció la tos como 
candidata para ser reconocida. ¿Se podría detectar la COVID-19 por 
medio de la tos? En ese momento, me puse a buscar si existían líneas 
de trabajo similares, encontrando una en el MIT y otra en Cambridge, 
además de otras iniciativas de grupos de investigación particulares 
alrededor del mundo. Inspirado en esos trabajos, junto con mi equi- 
po de trabajo del Grupo de Investigación en Interacción, Robótica 
y Automática de la Universidad Politécnica Salesiana, empezamos a 
idear las formas en que podríamos asumir dicho reto y posteriormente 
nos pudimos vincular con los equipos de investigación de la Escuela 
Politécnica Nacional y la Pontificia Católica Universidad del Ecuador 
para desarrollar un sistema de caracterización de una tos COVID. Para 
conseguir los objetivos propuestos, fue necesario inicialmente, estudiar 
todos los ámbitos relacionados con la pandemia, incluso aquellos que 
iban más allá de la ingeniería, por ejemplo, la evolución del número 
de contagios en Ecuador, la constitución misma del virus, los métodos 
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de diagnóstico existentes, etc. Todo este estudio se realizó antes de 
proponer un método para tratar de detectar características propias de 
una tos COVID-19. Ese aprendizaje está contenido en esta obra, donde 
se recoge toda la información que obtenía de los diarios, el internet 
y la bibliografía científica en relación con la pandemia, todo, con el 
fin de utilizarla como base en la solución que íbamos a proponer. 
Ya en la aplicación de la ingeniería, vimos que la metodología más 
conveniente para realizar una valoración de contagio de COVID-19 
por medio de la tos era el de la ciencia de datos, el reconocimiento de 
patrones y el aprendizaje automático. En esa línea, trabajamos desde 
varios enfoques, tanto para el tratamiento del audio en general, como 
para la posterior valoración de los ficheros de tos, definiéndolos, ya 
sea como una tos COVID o como una tos no-COVID. Los resultados 
obtenidos han sido muy interesantes, nos han mostrado claramente 
que la Ingeniería y dentro de ella, el reconocimiento de patrones por 
medio de sistemas automáticos constituye una herramienta poderosa 
para el tratamiento de señales de alta complejidad y también nos ha 
mostrado los limitantes de esta tecnología cuando no se cuenta con 
una ingente cantidad de datos. 


Queda por ver que nos depara la COVID-19 en el futuro, en 
un entorno donde la protección se asegura mediante dosis de vacunas 
de refuerzo permanentes y donde parece ser que nos acercamos más 
a una endemia que a la desaparición misma del virus. Lo que vaya a 
suceder, espero que nos encuentre mejor preparados para afrontarla 
y combatirla. 


Introducción 


“COVID-19: Respuestas desde la ingeniería y la inteligencia 
artifical” se define a sí misma como una obra de difusión científica, 
donde se tratan temas complejos relacionados con la pandemia me- 
diante un idioma natural y cercano que posibilita a la ciudadanía en 
general, comprender conceptos relacionados con el virus que provoca 
la enfermedad de la COVID-109, el funcionamiento de las vacunas, y 
las tecnologías basadas en Inteligencia Artificial utilizadas para ana- 
lizar señales audibles de tos. El tema central de la obra lo constituye 
la COVID-19, particularmente para el caso de estudio de lo acon- 
tecido en Ecuador, siempre desde un enfoque ingenieril, tratando 
de entender el comportamiento de los fenómenos relacionados que 
han ido sucediéndose a lo largo del tiempo. La obra se divide en tres 
secciones bien marcados en la lectura, marcados por el tipo de infor- 
mación disponible y por la aplicación de soluciones ingenieriles a la 
problemática de reconocimiento de características acústicas propias 
del virus en una señal audible de tos. 


La primera sección del libro se puede definir como un proceso 
de recopilación y análisis de información obtenida a través de los 
diferentes medios de comunicación periodística privados y estatales, 
escrito a modo de narrativa. Se expone información relacionada con 
el origen del virus, su propagación y la declaratoria de pandemia por 
parte de la OMS, también se relata, la llegada del virus al Ecuador y 
varios eventos relevantes relacionados como el proceso de vacunación 
masiva en el país. Posteriormente, se realiza un análisis estadístico de 
la evolución de la pandemia a diferentes niveles, local, regional y na- 
cional, describiendo los diferentes escenarios que fueron sucediéndose 
a lo largo del tiempo, para finalmente realizar un análisis de caso de 
impacto de la pandemia en dos localidades del país, determinando 
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las razones por las cuales la pandemia pudo afectar a unas regiones 
más que a otras. Toda esta información ha sido recogida casi en su 
totalidad a partir de información publicada en diarios de prestigio 
nacional e internacional, como El País y El Mundo de España, la BBC 
de Londres, el New York Times de Estados Unidos, El Universo y El 
Comercio de Ecuador y en la información ofrecida por el Gobierno 
Nacional a través de la Secretaría de Riesgos y posteriormente a través 
del Ministerio de Salud Pública, con los reportes diarios de contagios 
puestos a disposición de la ciudadanía. También se han utilizado fuen- 
tes de información como las páginas web de la OMS, el Ministerio de 
Salud Pública del Ecuador y del Gobierno Nacional. 


La segunda sección del libro está orientada a una descripción 
de las características propias del virus, su forma, la manera que actúa 
sobre el cuerpo y la forma como actúa el sistema inmune para hacerle 
frente. Para esto se realizó una búsqueda basada también en informa- 
ción de investigación periodística pero ya se pudo incluir información 
encontrada en publicaciones científicas relacionadas. A diferencia de la 
primera sección, en esta se van a poder encontrar algunas referencias 
científicas para lo expuesto, además de la información periodística de 
base. Lo que si es cierto es que se ha buscado que el lenguaje utiliza- 
do permita llevar una lectura de fácil comprensión. Posteriormente, 
en esta misma sección se habla sobre los métodos poco ortodoxos y 
hasta polémicos que se utilizaron para tratar la enfermedad, previo 
a la aparición de las vacunas. Para ello se buscó información cientí- 
fica que sustente los criterios expuestos, sin embargo, no resultó una 
tarea sencilla, comprobando la insuficiente evidencia científica que 
existe al respecto. Finalmente, en esta sección se hace un análisis y una 
descripción de la forma de actuar de las vacunas en nuestro cuerpo, 
debido a la gran cantidad de fabricantes de vacunas en el mundo, se 
analizaron las tres que más se han venido utilizando en nuestro país, 
según el plan de vacunación vigente. 


Por último, en la tercera sección del libro se presenta un análisis 
técnico relacionado con la caracterización de una señal de tos COVID-19 
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en base de la información recogida telemáticamente de señales audibles 
de tos. Para abordar esta temática, en primer lugar, se describen los 
antecedentes que motivaron este estudio, así como las estrategias de 
financiamiento para ejecutarlo. Posteriormente, se habla de las técnicas 
relacionadas como el procesamiento de habla, el aprendizaje automático 
y el reconocimiento de patrones y finalmente, se describen las técnicas 
de aprendizaje automático utilizadas para conseguir la caracterización. 
La información técnica derivada de la aplicación de las metodologías 
y técnicas para caracterizar la tos COVID, se encuentra contenida en 
las “Memorias del Proyecto de Investigación: Caracterización de la tos 
COVID-19 en pacientes con diagnóstico positivo”, documento al que 
se puede acceder, por el momento, libremente, siempre y cuando, se 
tenga un fin de investigación científica. Deberá solicitarse a csalameaO 
ups.edu.ec para proceder a su envío, previo llenado de un formulario 
de confidencialidad de la información. 


Así, en general, en la obra quedan plasmadas las experiencias 
vividas en lo que lleva de transcurrida la pandemia, siempre a la expec- 
tativa de si acaso estamos a la puerta de un desenlace, o si acaso, estamos 
a la espera de la aparición de nuevas variantes del virus o pérdida de 
inmunidad generalizada que podría complicar nuevamente la situación. 


En cualquier caso, estamos seguros de que el camino anda- 
do nos ha dejado experiencia suficiente para asumir nuevos retos y 
proponer alternativas de solución. En este sentido quiero agradecer 
al equipo de investigación con quienes llevamos a cabo el estudio de 
caracterización de una tos COVID-19 en pacientes con diagnóstico 
positivo, estudio que ha servido para sustentar varias de las propues- 
tas descritas en los capítulos finales de esta obra. El agradecimiento 
va con mención especial para los doctores Tarquino Sánchez, Javier 
Guaña, el magíster Xavier Calderón y los Ingenieros David Naranjo, 
Fernando Chica, Jessica Reina, David Romero, Santiago Luna y Paulo 
Castañeda. Sin ellos, no habría sido posible la determinación de las 
reales capacidades de los sistemas inteligentes para este tipo de tareas. 


Contexto histórico 


El origen de la propagación de un virus 


El 31 de diciembre de 2019 la Oficina de la OMS en la República 
Popular China detectó una declaración de la Comisión Municipal de 
Salud de Wuhan, en la que mencionaban casos de una “neumonía 
vírica” en esa localidad. Posteriormente, en el proceso de investigación, 
las autoridades chinas determinaron que dicha “neumonía vírica” 
denominada COVID-19, era provocada por un nuevo coronavirus 
llamado SARS-CoV-2. 


A pesar del impacto provocado por la COVID-19 alrededor del 
mundo y de sus implicaciones en torno al futuro de la humanidad, a 
día de hoy, no ha sido aún posible determinar aspectos clave sobre el 
origen y la propagación de virus que es capaz de provocar un tipo de 
neumonía grave y que ha provocado millones de muertes alrededor 
del mundo debido a su fácil transmisión, llegando a convertirse en la 
primera pandemia del siglo XXI. No se tiene conocimiento de quien 
pudo haber sido el paciente cero, ni tampoco se sabe de los animales 
que sirvieron de hospedadores y transmisores del virus a los primeros 
contagios en humanos, aunque en todo momento, tanto el murciélago 
como el pangolín han sido considerados como los causantes. 


Son ya más de dos años de las primeras informaciones rela- 
cionadas con un tipo de neumonía extraña aparecida en Wuhan, sin 
embargo, no parece que las organizaciones encargadas de estudiar 
el origen de la enfermedad han tenido o que vayan a tener el acceso 
suficiente a información por parte del gobierno chino, como para 
encontrar los elementos e indicios necesarios que pudieran llevar a 
aclarar lo acontecido. Lo que ha quedado en evidencia son los esfuerzos 
realizados por los actores interesados para evitar que la enfermedad 
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sea vinculada con el lugar de su aparición. Lo que se ha conseguido a 
pesar de los esfuerzos de personajes influyentes como Donald Trump 
quien, como otros, insistió en llamar a la enfermedad “el virus de 
Wuhan”, en nombre de la discriminación, se eliminaron los lugares 
de origen de la enfermedad y de sus variantes más predominantes. 


Son organizaciones no gubernamentales, otras sin fines de 
lucro y principalmente la comunidad científica, las más preocupadas, 
tanto, por la falta de claridad, como por las dificultades presentadas 
para determinar el origen del virus, al punto que, de manera espon- 
tánea, un grupo de científicos ha llegado a denunciar en la Revista 
Científica Nature el “estatismo” de los gobiernos y de las instituciones 
responsables de llevar a cabo este tipo de investigaciones (Koopmans 
et al., 2021). En principio, la dificultad se ha presentado debido a 
la “polémica política, los intereses que terminan enfrentando a las 
grandes potencias y las dificultades para realizar una investigación 
exhaustiva” (Domínguez, 2021). 


De lo que se ha podido observar en los diferentes medios de 
comunicación, prensa escrita y televisiva, los primeros casos de una 
neumonía grave atípica aparecieron en la ciudad de Wuham-China a 
finales de noviembre de 2019 (información que no confirmada hasta la 
fecha), por una transmisión a humanos aparentemente desde animales 
salvajes. Entre otras informaciones, se cuenta que tres investigadores 
del Instituto de Virología de Wuhan de China buscaron atención 
médica hospitalaria presentando síntomas relacionados con los de la 
COVID-19 en el mismo mes de noviembre de 2019 (Gordon et al., 
2021). Así, la opacidad en torno a la información de origen del virus, 
aviva las especulaciones de que, en realidad, el virus bien pudo haber 
sido creado artificialmente y que pudo haber escapado de manera 
accidental... o no. 


Hasta marzo de 2022, en base de la información entregada por 
el Coronavirus Resource Center de la Universidad Johns Hopkins, 
se contabilizan 464 724 503 casos confirmados, 6 063 104 fallecidos 
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por la enfermedad y 10 754 429 474 dosis de vacunas suministradas 
(Coronavirus Resource Center, s.f.). 


Más allá del tipo de origen, el lugar donde apareció el virus 
fue la ciudad china de Wuhan y dado el alto índice de contagio del 
virus, las autoridades locales y nacionales de China, siguiendo las re- 
comendaciones del comité científico que ya había manejado la crisis 
del SARS entre los años 2002 y 2003, decretaron el cierre total y el 
aislamiento de la ciudad de Wuhan, así como la inmediata construc- 
ción de hospitales para la atención de la emergencia. Wuhan es una 
ciudad dentro de la provincia de Hubei, que cuenta con alrededor de 
11 millones de habitantes, quienes, sin saberlo, estuvieron expuestos 
al virus, se contagiaron y provocaron una dispersión acelerada de la 
enfermedad colapsando el sistema de salud en pocos días. Para manejar 
la crisis sanitaria provocada, las autoridades locales llevaron a cabo, 
eficientemente, la construcción del hospital llamado Huoshanshen, el 
cual estuvo operativo apenas diez días después del inicio de su cons- 
trucción. Contaba con una capacidad para atender 1000 pacientes 
(BBC, Redacción, 2020a), lo que posibilitó la atención de un mayor 
número de personas. Posteriormente, se construyó otro con capaci- 
dad para atender a 1500 pacientes (DW, Redacción, 2020), pero aun 
así, el sistema sanitario colapsó. La rápida dispersión del virus a todo 
nivel llevó a que se estudien sus causas. Encontrando, entre dichas 
causas, que existen personas supercontagiadoras (Mediavilla, 2020) 
capaces de dispersar el virus mucho más que otras y un detalle que 
cambió radicalmente las reglas de juego conocidas hasta ese momento 
en relación con la enfermedad, que personas sin síntomas podían y 
pueden transmitir la enfermedad (El Universo, Redacción, 2020a). 
Aun cuando la OMS, hacia el 8 de junio de 2020, manifestaba que 
parecía “muy raro” que las personas sin síntomas pudieran transmi- 
tir la enfermedad, a pesar de que la evidencia científica mostraba lo 
contrario (El Comercio, Redacción, 2020). Este detalle hacía que el 
contagio fuera prácticamente incontrolable y la única alternativa que 
se encontró fue el aislamiento total de las personas en sus domicilios, 
esperando que el índice de contagios no subiese estrepitosamente y 
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que los sistemas de salud fueran capaces de soportar la presión de los 
pacientes ya afectados. También se pudo comprobar que el tiempo de 
incubación del virus era de O a 14 días (Zaki y Mohamed, 2021) y que 
las personas que se habían curado podían transmitir el virus incluso 
luego de dos semanas de haber obtenido el negativo. 


Aún con todas las medidas de aislamiento establecidas en Wuhan 
el virus se esparció por China, Japón y Corea del Sur. Este último luego 
de un importante aumento del virus en sus indicadores, fue el país 
que mejor supo manejar la crisis en base con las siguientes medidas: 


+  Fueel único país capaz de cerrar los cercos epidemiológicos, 
logrando ubicar a los infectados y a sus contactos más cer- 
canos. Con esta medida lograron establecer todos los focos 
de infección acontecidos en el país. 

+ Se impuso el uso obligatorio de mascarillas tanto fuera como 
dentro de casa. 

» Se recomendaron medidas estrictas de aislamiento social, 
medidas que la ciudadanía supo llevar a cabo. Esto implicaba 
y mostraba al mundo que la disciplina era y es un aspecto 
clave en el manejo de la crisis. 


El 11 de febrero de 2020, la OMS anunció que la enfermedad 
causada por el nuevo coronavirus sería llamada COVID-19, procu- 
rando evitar inexactitudes y estigmatización; por ello, no se refiere a 
una ubicación geográfica, a un animal, a una persona ni a un grupo de 
personas (BBC, Redacción, 2020b). Según la misma OMS, a la enferme- 
dad provocada por el virus se le dio el nombre de CoVid-19, nombre 
que se tomó de las palabras “corona”, “virus” y “disease”, mientras 
que 19 representa el año en que surgió (el brote se informó a la OMS 
el 31 de diciembre de 2019). En lo que se refiere al virus, el Comité 
Internacional de Taxonomía de Virus (ICTV) lo llamó SARS-CoV-2, 
un nuevo miembro de la familia de los SARS-CoV. 


En lo que respecta a Europa, el virus llegó en primer lugar a Italia 
y a pesar de que el primer caso “oficial” fue el de una persona que se 
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presentó el 21 de febrero de 2020 en un pueblo cerca de Milán, otros 
estudios manifiestan que el virus estuvo en Italia hacia septiembre de 
2019 y que la COVID-19 podría haberse extendido fuera de China 
antes de lo que se cree. Más allá de la fecha en la que el virus empezó a 
circular en Italia, lo cierto es que a partir de febrero de 2020 la situación 
se volvió caótica en el Sistema Sanitario Italiano debido al incremento 
exponencial de los contagios. Luego llegó a España donde tampoco 
pudo controlarse y se llegó a una presión similar en los sistemas de 
salud españoles. Esta cadena de hechos desemboca en una de las teorías 
de llegada del virus a Ecuador, dado que “según información oficial” el 
virus llegó a Ecuador desde España y particularmente desde la región 
de Torrejón de Ardoz. 


La declaratoria de pandemia 


A mediados de febrero de 2020 se tenían ya niveles altos de 
transmisión comunitaria en países como Irán, Italia y España, niveles 
que empezaron a aparecer en más países, hasta que el 11 de marzo 
de 2020, la OMS declaró al COVID-19 como una pandemia (OPS, 
2020a). En el Ecuador, mediante acuerdo ministerial No. 00126-2020 
emitido el 11 de marzo de 2020 por la Ministra de Salud de entonces, 
Catalina Andramuño, se declaró el estado de emergencia sanitaria en 
el Sistema Nacional de Salud con el fin de mitigar la propagación del 
virus. Se interpuso el aislamiento preventivo obligatorio, por un tiempo 
de 14 días, a todo viajero que ingresará al país desde China (Hubel y 
Guandong), Italia, España, Francia, Irán, Alemania, Corea del Sur y 
Estados Unidos, se dispuso la suspensión de las clases en todo el país 
y se activó el número telefónico 171 para atención en salud. 


La llegada de la pandemia al Ecuador 


El virus llegó al Ecuador presumiblemente desde España a me- 
diados de febrero de 2020 y para abril de 2020 ya se registraban 17 162 
muertes en el país debidas a la COVID-19, golpeando de sobremanera 
ala ciudad de Guayaquil y la provincia del Guayas, que concentró más 
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del 60 % de los decesos con 10 700 (El Universo, Redacción, 2020b). 
Según el documental ecuatoriano “Paciente Cero” dirigido por Eduardo 
Alcívar González que se puede ver en YouTube, se indica que el paciente 
0 que llegó a Ecuador fue una mujer, adulta mayor de 71 años, ecuato- 
riana de que residía en la ciudad Torrejón de Ardoz, perteneciente a la 
Comunidad de Madrid y que llegó de visita al Ecuador el 14 de febrero 
de 2020 para disfrutar del feriado de carnaval. Si bien la paciente, según 
Susana Morán, autora del artículo “Esta es la historia no contada de 
la paciente O en Ecuador” (Morán, 2020), en el mismo vuelo ya había 
presentado fiebre y malestar, luego de varias visitas a diferentes insti- 
tuciones en búsqueda de atención, solo fue ingresada en el Hospital 
Alcívar de Guayaquil el 23 de febrero, cuando ya presentó problemas 
respiratorios y tos. Previo a esa fecha, el malestar era permanente, pero 
en las instituciones hospitalarias que visitó no consideraron que fuera 
causa para un ingreso hospitalario. Solo el 29 de febrero, mediante rueda 
de prensa, la Ministra de Salud de ese entonces Catalina Andramuño, 
anunció a este caso oficialmente como el primer caso de coronavirus 
en el Ecuador. Sin embargo, el Comité de Operaciones de Emergencia 
(COE) nacional reveló el día 12 de mayo de 2021 que el primer caso 
de COVID-19 en Ecuador se habría producido realmente el día 12 
de febrero con un ciudadano de residencia en la parroquia Pascuales 
en Guayaquil (El Universo, Redacción, 2020c), pero de este caso en 
particular no existe más información. 


La ciudad más afectada por el virus en el Ecuador y muy proba- 
blemente en el mundo ha sido la ciudad de Guayaquil, donde la des- 
información fue una constante al igual que en el resto del país. Si bien 
se brindó información desde el 29 de febrero en relación con el primer 
caso, en el transcurso de los siguientes días se mantuvo dicho número, 
lo cual era poco real ya que, aunque el requerimiento de hospitalización 
no se haya dado masivamente en los primeros días, se conoce ahora que 
muchos positivos del virus eran asintomáticos, pero podían transmitir 
la enfermedad, con lo que seguramente el virus se estuvo desplazando 
silenciosamente. Fue apenas en los días 16 y 17 de marzo cuando exis- 
tieron repuntes de orden exponencial, llevando los 37 casos existentes el 
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15 de marzo, a 58 y posteriormente a 111. El Gobierno Nacional, en base 
de la información estadística del aumento de contagios fue implemen- 
tando medidas de restricción de movilidad que al inicio fueron parciales. 
Dado que el virus ya se encontraba en la comunidad (principalmente 
en la provincia del Guayas) se pasó al tercer escenario que consistía en 
frenar el crecimiento o lo que es lo mismo tratar de aplanar la curva 
de contagios. Las clases se suspendieron a nivel nacional al igual que el 
transporte interprovincial, el ingreso de extranjeros y de nacionales se 
prohibió, principalmente porque se asumió que el crecimiento se debía 
a casos importados. Las predicciones apuntaban a que los números 
seguirían aumentando exponencialmente, sin embargo, el Gobierno 
Nacional esperaba contar con resultados de las medidas implementadas 
hasta cuatro o cinco días después. Como se pudo comprobar luego 
de ese tiempo que el crecimiento de la emergencia iba en aumento, se 
tomaron medidas como las que se habían tomado ya en Asia y Europa, 
restringiendo completamente la circulación de personas. Eso nos llevó 
a todos al confinamiento total. 


Se ha especulado mucho sobre los motivos que llevaron a que 
en Guayaquil se produjera la expansión del virus de una manera tan 
descontrolada, pero lamentablemente no han aparecido estudios 
científicos que pudieran dar luz en este sentido. Lo que se sabe es 
que, el 29 de febrero de 2020, con poca o ninguna información sobre 
la presencia del virus en el país, la Ministra de Gobierno de ese mo- 
mento, María Paula Romo, anunció la suspensión de eventos masivos 
en Guayaquil y Babahoyo, autorizando los eventos deportivos, pero 
“sin público” al haberse detectado el primer caso de COVID-19 en 
Ecuador (El Universo, Redacción, 2020d). Sin embargo, y sin ofrecer 
información a la ciudadanía, el día 2 de marzo de 2020, cancelaba 
dicha medida y autorizó que se lleve a cabo un partido de fútbol de 
primera categoría con asistencia de aficionados, esto luego de consultas 
realizadas al Ministerio de Salud y a otros organismos. Así, el parti- 
do de fútbol entre Barcelona e Independiente del Valle por la Copa 
Libertadores de América se desarrolló sin ningún tipo de restricción 
o control. El Gobernador del Guayas de ese entonces, Pedro Pablo 


CHRISTIAN SALAMEA PALACIOS 


22 


Duart, animaba a la ciudadanía diciendo que “no se dejen ganar por 
el temor” (El Universo, Redacción, 2020€e). A dicho evento, asistieron 
como mínimo 30 000 personas, con una exposición directa al virus, 
ya que no estaba establecido ningún protocolo de bioseguridad, ni 
tampoco el uso de mascarillas. Sería al 31 de marzo de 2021 cuando 
empezaron a aparecer cadáveres abandonados en varias esquinas de la 
ciudad de Guayaquil debido a la imposibilidad de mantenerlos dentro 
de las casas, principalmente por la descomposición que empezaban 
a presentar. El ECU911, institución encargada del levantamiento de 
cadáveres en la urbe, no daba abasto para atender a todas las solici- 
tudes presentadas por la ciudadanía para la recogida de los fallecidos 
(El Universo, Redacción, 2020f). Con lo que sabemos hoy sobre la 
incubación del virus y su mortalidad, bien se puede correlacionar que 
al menos una parte del impacto del coronavirus en Guayaquil estuvo 
influida por esa decisión de permitir un evento masivo con asistencia 
de público a inicios de marzo de 2020. 


A partir de estos hechos, la provincia del Guayas fue la que re- 
presentó el mayor foco de contagio del país hasta muy avanzada la 
pandemia. Se dieron eventos propios de ciencia ficción, como cuando 
la alcaldesa de entonces, prohibió el aterrizaje de vuelos comerciales que 
llegaban a Guayaquil para repatriar a extranjeros, colocando automó- 
viles municipales a lo largo de la pista del aeropuerto José Joaquín de 
Olmedo (Flores, 2020). Este hecho, es solo una muestra del estado de 
caos que se vivió en el país a consecuencia de la COVID-109. Las noticias 
trágicas eran el pan de cada día de los noticieros, las cuales se sucedían 
a pesar de la declaración del estado de emergencia sanitaria decretada y 
del estado de excepción por parte del Gobierno Nacional. El Sistema de 
Salud ecuatoriano estuvo bajo una inmensa presión constante durante 
los meses siguientes, aplacándose únicamente con la llegada de la vacuna. 


El proceso de vacunación contra la COVID-19 en Ecuador 


La vacuna de Pfizer fue la primera en arribar al país el día 20 
de enero de 2021 en un avión comercial a la ciudad de Quito. El pri- 
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mer lote estuvo constituido por 8000 dosis que fueron distribuidas al 
personal de salud de primera línea. Estas 8000 dosis formaban parte 
de un total de 86 000 dosis adquiridas por el país, y fueron utilizadas 
en la Fase O del plan de vacunación, la cual consistió en inocular al 
personal de salud de primera línea de atención médica, adultos ma- 
yores de centros geriátricos y al personal que trabajaba en su cuidado 
(Ministerio de Salud Pública, 2021a). Esta fase culminó el día 2 de 
marzo dado que la Fase 1 inició el día 3 de marzo con la llegada de 
una cuarta remesa de vacunas Pfizer con 31 590 dosis. En la Fase 1 se 
distribuyeron las vacunas para el personal de salud no incluido en la 
Fase 0, a la policía y fuerza pública, docentes, población vulnerable, 
personas de la tercera edad, personal de recolección de desechos y 
personal de sectores estratégicos. En total, en esta fase se planificó 
la vacunación de alrededor de dos millones de personas ya que se 
contó con nuevos cargamentos de la vacuna de Pfizer y las dosis de la 
iniciativa Covax (Ministerio de Salud Pública, 2021b). Sin embargo, 
en medio de la Fase 1 hubo cambio de gobierno y la nueva admi- 
nistración decidió activar el plan de vacunación de nueve millones 
personas en 100 días, la cual incluía, por una parte, la Fase 1 que ya 
estaba en marcha incluyendo a personas de 50 a 64 años, personas 
de 16 a 49 años con discapacidades y enfermedades crónicas, y por 
otra, la Fase 2 que incluía a personas de 16 a 49 años, niños mayores 
de 12 años con discapacidad y enfermedades crónicas y la población 
migrante. La meta de los nueve millones de personas vacunadas con 
primeras dosis se cumplió el 31 de agosto de 2021. A partir de esa 
fecha, se activó la Fase 3 donde se incluyeron todos los rezagados 
de las fases anteriores. A partir de entonces, se ha tenido un proceso 
periódico de vacunación para la tercera dosis de refuerzo, la cual se 
inoculó a partir de los 6 meses de haber recibido la segunda dosis. En 
ese sentido, se ha confirmado también una cuarta dosis de refuerzo y 
que el proceso de vacunación iniciaría en mayo de 2022 (El Universo, 
Redacción, 2022). Dicho proceso ha comenzado y está habilitado para 
todas las personas que hayan recibido la tercera dosis con al menos 
cinco meses de antelación. 


Los números de la pandemia 
en el Ecuador 


Las acciones del estado en el manejo de la información 


Si bien el primer caso de COVID-19 detectado en el Ecuador 
fue el 29 de febrero de 2020 (Secretaría General de Comunicación 
de la Presidencia, 2020), el Ministerio de Salud Pública en conjunto 
con la Secretaría de Gestión de Riesgos, emitieron informes diarios 
de la situación en el país a partir del 13 de marzo de 2020, día en el 
cual se activó el COE Nacional para la coordinación de la emergencia. 
El primer informe, que consta de cuatro folios, describía el número 
de contactos vinculados a casos confirmados (205), el total de casos 
confirmados (20) y el número de fallecidos (1). Además, presentó 
información relacionada con las acciones de respuesta de Sistema 
Nacional Descentralizado de Gestión de Riesgos, el reporte de ingresos 
al país por aeropuerto y el listado de hospitales habilitados para la 
atención de casos COVID-19. Según como fueron pasando los días, 
el número de contagios aumentaba en todo el país y los informes se 
fueron adecuando a un único folio que contenía información gráfica 
y estadística de la evolución del virus en el país. Así, a partir del 26 
de marzo de 2020 (figura 1) se había establecido un formato, con 
pequeñas variaciones en el tiempo, que fue el que se utilizó para los 
18 meses siguientes hasta cuando el proceso de inoculación en el país 
se había masificado. 
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Figura 1 
Formato utilizado por el Gobierno Nacional para mostrar la evolución de la 
pandemia 
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En dicho formato se informaba, a nivel nacional y provincial, el 
número de contagiados, sospechosos, fallecidos, descartados y recupe- 
rados, se indicaba los contagios por bandas de edad, así como el estado 
de personas contagiadas, ya sean, estables en aislamiento domiciliario, 
los hospitalizados estables y los hospitalizados con pronóstico reser- 
vado. Adicionalmente se mostraba el número de muestras realizadas 
por día a nivel nacional y la tendencia de contagio relacionada con 
el género. Si bien era claro de que los datos mostrados no eran los 
reales, si es cierto que mostraban valores de tendencia que permitían 
visualizar cual era el comportamiento de la pandemia en las diferentes 
ciudades. Todos los informes emitidos desde el 13 de marzo de 2020 
hasta el 23 de julio de 2021 se encuentran publicados en https: //www. 
gestionderiesgos.gob.ec/informes-de-situacion-covid-19-desde-el- 
13-de-marzo-del-2020/, dado que ese mismo día el COE Nacional 
resolvió disponer al Ministerio de Salud Pública para que en adelante 
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establezcan los mecanismos para publicar, socializar y actualizar las 
cifras relacionadas con la evolución de la pandemia en el país. A partir 
del 24 de julio de 2021, la información de evolución de la pandemia 
se puede encontrar en: https://www.salud.gob.ec/informes-de-situa- 
cion-sitrep-e-infografias-covid-19-desde-26-07-2021/. Este formato 
difiere significativamente en relación con el formato utilizado por la 
Secretaría de Gestión de Riesgos, por lo que decidí realizar el análisis 
de evolución de la pandemia con corte al 23 de julio de 2021 que es la 
fecha en la cual, gracias a la aparición de las vacunas, la presión sobre 
el sistema de salud disminuyó a niveles controlables. 


La evolución de la pandemia a nivel nacional 


La información entregada por la Secretaría de Gestión de Ries- 
gos del 13 de marzo de 2020 hasta el 23 de julio de 2021, como la del 
Ministerio de Salud Pública del 24 de julio de 2021 al 28 de febrero 
de 2022 han sido utilizadas para mostrar la evolución de la pandemia 
a nivel nacional, con base en de dos de las variables más importan- 
tes: el número de contagios y el número de fallecidos. Cabe indicar 
que, dentro de la estadística de fallecidos, se incluyen aquellos que 
se consideran probables y también aquellos que contaron con una 
certificación médica positiva a COVID-19. 


Figura 2 
Evolución de la pandemia en escala lineal 
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En la figura 2 se muestra, en escala lineal, el número de con- 
tagios y el número total de fallecidos (con certificación positiva y 
probables). Se coloca esta figura dado que en ella se pueden identificar 
varios factores importantes. El principal probablemente constituye la 
evidencia del aumento de contagios a partir del inicio de 2022 y la 
estabilidad en el número de fallecidos, esto bien puede constituir un 
indicador de control de la pandemia en nuestro país. Este aumento 
del número de contagios se debe muy probablemente a la aparición de 
la variante ómicron que se ha presentado como una variante mucho 
más contagiosa y con una capacidad de dispersión muy alta (Pastorelli, 
2022) que se ha podido comprobar con olas de contagios en otros 
países (Guell, 2021; Cué, 2021). Sin embargo, se ha comprobado que 
es menos letal, dado que es incapaz de vencer a los linfocitos tipo T 
de nuestro organismo (EFE, Johannesburgo, 2021). Este factor, junto 
con una tasa de vacunación alta en la población ha llevado a que en 
algunos países se flexibilicen las normas de bioseguridad y que em- 
piecen a tratar a la COVID-19 como una endemia (Simó, 2022), cuyo 
tratamiento es el mismo que se le da a un cuadro gripal, sin embargo, 
cabe recalcar que oficialmente, a día de hoy, la enfermedad causada 
por el SARS-CoV-2 sigue siendo considerada una pandemia. 


Otro de los factores importantes presentado en la figura 2 es la 
desaceleración del número de contagios a partir de mediados de julio 
de 2021, mes en el cual el proceso de vacunación en nuestro país se 
masificó, lo que da cuenta de que las vacunas realmente funcionan 
y que constituyen un factor determinante para la protección de la 
ciudadanía frente al virus. 


Ya en términos de análisis de evolución de la pandemia, en 
lugar de una escala lineal, se utiliza la escala logarítmica dada su ca- 
racterística de ser más específica en el corto plazo y más generalista 
al largo plazo, con lo que permitió identificar el comportamiento de 
la pandemia al inicio y también la proyección sobre los datos futuros. 
Por este motivo, en la figura 3 se muestran los mismos datos de la 
figura 2, pero en escala logarítmica. 
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Figura 3 
Evolución de la pandemia en escala logarítmica 
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Como se comentó líneas arriba, la escala logarítmica posibilita 
el análisis a largo plazo de la evolución de la pandemia y se puede 
comprobar como el “aplanamiento” de la curva se ha conseguido en 
cuanto al número de fallecidos, lo que hace prever que la pandemia 
está bajo control, también en lo que se refiere al número de contagios, 
a pesar de la irrupción de la variante OMICRON, se puede observar 
que a día de hoy, la curva también tiende a aplanarse. Ya hablando del 
corto plazo, se puede ver el comportamiento del número de contagios 
y del número de muertes totales, viendo como tienen la misma ten- 
dencia, evidenciando la alta letalidad del virus al inicio de la pandemia. 


Otro indicador de control de la pandemia se puede verificar 
comprobando el número de nuevos casos con los de las muertes pro- 
ducidas, dado que por una parte, permite evaluar si las medidas de 
contingencia funcionan o no y por otra parte, permite analizar si la 
letalidad del virus varía en el tiempo debido a diversas circunstancias 
como un debilitamiento del virus debido a las mutaciones del mismo 
o a una consecución de la “inmunidad de rebaño” generada ya sea por 
el contagio masivo y posterior recuperación de personas que forman 
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un “escudo” para los no infectados o por la “inmunidad” conseguida 
con las vacunas. 


Figura 4 
Comparativa del número de nuevos casos y muertes diarias 
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En la figura 4 se puede notar como a lo largo de la pandemia 
existe una correlación entre el número de contagios diarios y el nú- 
mero de muertes en el mismo período de tiempo, lo que indica que 
a priori el virus no había perdido su potencia. Con la llegada de la 
vacuna a mediados de 2020 se puede notar un descenso en los nuevos 
contagios y también un descenso en el número de muertes diarias. El 
punto de disrupción se puede ver a finales de 2021 donde se puede 
observar claramente que el número de contagios aumenta pero que 
el número de muertes diarias disminuye de manera significativa, 
indicando que la letalidad del virus ha disminuido por cualquiera 
de la razones expuestas líneas arriba, siendo mucho más probable la 
de la “inmunidad” obtenida por la vacunación, lo que indica que de 
no ser por las vacunas, con la variante ómicron habríamos tenido un 
panorama similar al del inicio de la pandemia e incluso más fuerte 
debido a la mayor capacidad de contagio de la variante referida. 
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Evolución de la pandemia por regiones 


En la región de la Costa, la provincia del Guayas fue la que 
más casos registró al inicio de la pandemia con un pico de contagios 
a mediados de abril de 2020. Luego de ello se estabilizó a lo largo del 
tiempo con un incremento constante pero controlado de los casos. Las 
provincias de Manabí y El Oro presentaron a lo largo de la pandemia 
un crecimiento sostenido, aunque en la primera se acusó de manera 
más significativa las deficiencias del sistema de salud. Se conocieron de 
varios casos en los que ciudadanos manabitas buscaron en otras pro- 
vincias (como Azuay) la atención que no encontraban en Manabí. La 
provincia de Los Ríos y Santa Elena también registraron picos al inicio, 
pero luego fue más controlado. Tal como se puede ver en la figura 5. 


Figura 5 
Evolución de los contagios en la región Costa 
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En la Sierra, la provincia de Pichincha es la que más contagios 
registró continuada por la del Azuay; el resto de provincias de la Sierra 
se mantuvieron en números similares de contagios, tal como se puede 
ver en la figura 6. 


CHRISTIAN SALAMEA PALACIOS 


32 


Figura 6 
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En lo que corresponde a la región Oriental se tuvo en todas las 
provincias un crecimiento de contagios similar (figura 7), al ser una 
zona donde no existen aeropuertos internacionales y tampoco están las 
ciudades más pobladas del Ecuador, la pandemia tardó más tiempo a 
llegar allí, dando la posibilidad a la población a protegerse y de tomar 
precauciones frente a posibles fuentes de contagio. Esto permitió que 
la pandemia se pudiera controlar de mejor manera en comparación 
con las ciudades grandes de la Costa o de la Sierra. 


La región insular fue donde mejor se pudo gestionar la pande- 
mia, al estar distanciada del Ecuador continental le permitió controlar 
y evitar los contagios generados alrededor del mundo. Los casos que 
llegaron provocaron problemas como en todos lados, pero allí se 
pudieron gestionar de mejor manera. 


En general, hablando ya de las regiones en su contexto, se pue- 
de evidenciar que hay una correlación directa entre el tamaño de 
la población y la cantidad de contagios. Así, las provincias más po- 
bladas como son Guayas y Pichincha, son las que más casos suman, 
evidentemente, con una mayor población concentrada en una zona, 
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se vuelve más complicado el distanciamiento social y por tanto, los 
contagios son mayores. 


Figura 7 
Evolución de los contagios en la región Oriental 
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Evolución de la pandemia a nivel provincial 


El análisis de la pandemia a nivel provincial es posible dado que 
en los formatos emitidos por la Secretaría de Gestión de Riesgos se 
entregaba información detallada del número de contagios a nivel de 
provincia, sin embargo, en los formatos posteriormente emitidos por 
el Ministerio de Salud Pública no se evidenció dicha información. Por 
esta razón, el análisis a nivel provincial tiene fecha de corte al 23 de 
julio de 2021, tal como fue descrito anteriormente. El análisis a nivel 
provincial es muy importante, dado que permitió identificar focos de 
contagio, así como valorar la efectividad de las medidas de contención 
del virus y también para destinar recursos al Sistema Sanitario de cada 
provincia, según la evolución de la pandemia 


Una gráfica que resulta muy interesante y que ofrece una gran 
cantidad de información es la correspondiente a la tasa de letalidad del 
virus, la cual se define como el cociente entre el número de muertes pro- 
vocadas y el número de contagios. Esta gráfica se muestra en la figura 8. 
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Figura 8 
Tasa de letalidad a nivel de provincia 
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A pesar de que la información entregada por el Gobierno Nacio- 
nal podía distar y mucho de la realidad en la cantidad de contagios y la 
cantidad de decesos provocados por la COVID-19, como se ha dicho, 
permite realizar varios tipos de análisis en relación con lo acontecido 
durante la pandemia. 


Al inicio se puede notar un pico (marrón) correspondiente a los 
datos de la provincia del Guayas, la que, sin duda, fue la provincia que 
recibió el golpe inicial de la pandemia y encontró a toda la población 
con poca o ninguna protección. Llama la atención un pico posterior 
pero también importante de la provincia de Cotopaxi, cuyo impacto, 
de seguro no fue igual al de la provincia del Guayas, pero no por ello 
deja de ser significativo, más aún tomando en cuenta la dispersión de 
la población de una provincia como Cotopaxi. 


Luego de estos dos picos se puede notar un período caótico, 
donde se puede concluir que no se pudo tener ningún control de la pan- 
demia, todo esto hasta aproximadamente finales de mayo. Luego de esta 
fecha, la tasa de letalidad de todas las provincias fue descendiendo con 
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el pasar de los días, lo que indicaba que las medidas de distanciamiento 
social habían resultado fundamentales para combatir la pandemia. La 
tendencia descendente de la letalidad se ve interrumpida a finales de 
agosto, cuando en un “sinceramiento” de los datos por parte del Go- 
bierno Nacional, se incluyeron dentro de las estadísticas de fallecidos, a 
aquellos “probables” quienes pudieron haber presentado sintomatología 
asociada a la COVID-19 pero que no tenían una prueba certificada de 
la misma. Así, todas las provincias pasaron a reflejar una letalidad más 
alta del virus a partir de dicha fecha. Luego de ello, el comportamiento 
de la curva se repite hasta el 20 de julio de 2021, cuando, sin ningún 
evento particularmente importante, aumenta el número de fallecidos 
de una manera muy significativa en cada provincia. Por ejemplo, en la 
provincia del Azuay, se aumenta el número de fallecidos confirmados 
de COVID-19 de 526 a 1087, lo que representa un aumento de más 
del 100 % de los casos confirmados, en tanto que en los casos proba- 
bles se muestra un aumento de 46 a 205, que representa más de un 
400 % de aumento de los casos. Este cambio significativo, se replica 
de mayor y menor manera a lo largo de la información de cada una 
de las provincias, elevando la letalidad del virus a nuevos estándares 
inéditos en toda la evolución de la pandemia. Hasta antes del 20 de 
julio de 2021, la tasa de letalidad por provincia era la mostrada en la 
figura 9 y representaba una letalidad promedio del 5 %. 


Figura 9 
Tasa de letalidad (en porcentaje) a nivel de provincia al 19 de julio de 2021 
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En tanto que la letalidad para el 23 de julio de 2021, apenas 
cuatro días después presentaba los datos presentados en la figura 10, 
con una letalidad promedio de 6,72 %. 


Figura 10 
Tasa de letalidad (en porcentaje) a nivel de provincia al 23 de julio de 2021 
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Las figuras 9 y 10 muestran que la mayor letalidad del virus se 
presentó en la provincia de Santa Elena y en la de Manabí, seguida 
por la de Chimborazo, El Oro y Los Ríos. Cuatro de las cinco pro- 
vincias con más letalidad del virus pertenecen a la región de la Costa 
Ecuatoriana, lo que lleva a pensar que debieron existir factores que 
influyeron para que el virus se disperse de manera más significativa 
en dicha región. No es objeto de estudio de esta publicación investigar 
dichos factores, pero se muestra la información para que pueda ser 
considerada como insumo de base. 


Análisis de caso 


Con el fin de indagar sobre el impacto del virus en las diferentes 
provincias del país, se realizó un análisis específico entre las ciudades 
con la mayor y menor letalidad, considerando que tuvieran un índice 
de contagio similar. En ese contexto, se eligió a la provincia del Azuay 
y a la de Manabí, con fecha de corte al 10 de octubre de 2020. Para 
dicha fecha, con un número de contagios aproximadamente de 10 000 
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personas, la cantidad de decesos producidos por la enfermedad en el 
Azuay fue de 174, en tanto que, en Manabí, fue de 1985. Para ilustrar 
mejor este particular se muestra la figura 11. 


Figura 11 
Comparativa de letalidad del virus en Azuay y Manabí al 10/10/2020 
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La diferencia en la cantidad de decesos es muy significativa 
en las dos provincias como para solo atribuirla a los datos tardíos y 
subestimados del Gobierno Nacional. De seguro las medidas de dis- 
tanciamiento no funcionaron de igual manera, ya sea por correspon- 
sabilidad ciudadanía o por falta de comunicación de las autoridades. 
También es probable que el sistema de salud a nivel de provincia 
funcione mejor en unos lugares y peor en otros y que con el pasar de 
los días, ese factor pudo derivar en que la letalidad del virus sea muy 
diferente en una zona y otra de un mismo país. De tomar esta proba- 
bilidad como real, significaría que el país hizo lo que pudo en cuanto 
a la pandemia, pero que, de haber tenido una planificación en cada 
uno de los hospitales del sistema de salud público, se pudo disminuir 
y mucho los efectos de la pandemia. Según el estudio realizado por 
Velasco (Velasco y Hurtado, 2020), previo al brote de la COVID-19, la 
disponibilidad de profesionales de salud era desigual en el territorio, 
tal como se puede ver en la figura 12, donde la escala en verde se utiliza 
para indicar la cantidad de profesionales de salud disponibles en cada 
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provincia, correspondiendo el verde más oscuro a un número mayor 
de profesionales y el verde más claro a un número menor. 


Figura 12 
Tasa de profesionales de la salud por provincias 
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Nota. http://library.fes.de/pdf-files/bueros/quito/16860.pdf 


Y en lo referente a la capacidad hospitalaria, a pesar de que 
existieron las unidades de salud según lo sugerido por la OPS-OMS, 
en varias provincias se rebasó la capacidad de atención, en principio, 
debido a las características propias de dispersión y gravedad de la 
enfermedad, pero también, debido a que el nivel primario de atención 
no estuvo consolidado en el país y se priorizó la atención curativa 
(Velasco y Hurtado, 2020). Esto se puede ver en la figura 13, donde 
la escala en grises ha sido utilizada para representar la cantidad de 
camas disponibles a nivel de provincia, correspondiendo el gris más 
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oscuro a un número mayor de camas disponibles y el gris más claro 
a un número menor. 


Figura 13 
Capacidad hospitalaria por provincias 
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Nota. http://library.fes.de/pdf-files/bueros/quito/16860.pdf 


Tal y como se puede ver en las figuras 12 y 13, la infraestructu- 
ra hospitalaria y el personal médico disponible marcó directamente 
el rumbo de la pandemia en el país. Se puede notar que, provincias 
como Manabí, Santa Elena o Chimborazo contaron con las peores 
condiciones para afrontar la pandemia y por ello son aquellas donde 
los índices de letalidad son más altos que en el resto de provincias. 


Qué es y cómo actúa 
el virus SARS-Cov2 


Estructura y funcionamiento 


El reconocimiento de patrones constituye una herramienta 
fundamental para la evolución de la especie y ha llevado a que se 
pueda conocer y comprender de mejor manera el funcionamiento del 
mundo que nos rodea. A partir de este conocimiento y con el pasar 
del tiempo, se ha podido desarrollar paulatinamente la tecnología 
necesaria para sacar ventaja de los elementos que constituyen nues- 
tro entorno. En la actualidad, por ejemplo, utilizamos la electricidad 
como soporte doméstico e industrial para una infinidad de tareas, y su 
descubrimiento se produjo en medio de un continuo procedimiento 
experimental llevado a cabo por científicos entusiastas, quienes a 
lo largo del tiempo, desde los antiguos griegos hasta Maxwell fue- 
ron capaces de reconocer patrones característicos del fenómeno del 
movimiento de carga eléctrica a lo largo del tiempo hasta llegar a la 
comprensión total de la electricidad al unificarla con el magnetismo 
en lo que se conoce como el “fenómeno electromagnético” (Forbes y 
Mahon, 2014). Así como con este ejemplo, podemos ir hacia atrás tanto 
como queramos y para cada uno de los fenómenos que se presentan 
en la naturaleza, se podrá identificar un elemento común en cada 
cambio de época en la historia de la humanidad que es la capacidad 
de los Sapiens para reconocer eventos, fenómenos y cambios en la 
naturaleza (Harari, 2015; Burke, 2003). Esta capacidad de reconocer 
patrones sigue viva en la esencia misma de los seres humanos y sigue 
generando conocimientos que seguramente nos permitirán reconocer 
otros patrones hasta ahora desconocidos. 
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El ámbito de la medicina y la cura de las enfermedades no es- 
capan de este mecanismo tan propio de los Sapiens para resolver sus 
problemas. Las vacunas, los antibióticos, el diagnóstico de enferme- 
dades se basan fundamentalmente en el reconocimiento de elementos 
característicos que están afectando al organismo. En esencia, lo que 
se puede reconocer es más fácil de curar. 


Ya en el tema de la COVID-19, la situación de emergencia sa- 
nitaria presentada alrededor del mundo conllevó que, desde varios 
enfoques y en sin número de centros de investigación científica, se 
procurara el reconocimiento del virus, identificar, a nivel genético, sus 
propiedades y sus características fundamentales. En esencia, se buscó 
reconocer los patrones necesarios para poder actuar sobre ellos. Lo 
primero consistió en definir una serie de patrones que definieran que 
una persona podría tener el virus. Para ello, básicamente se reconoció 
la sintomatología provocada por la enfermedad en el organismo de los 
seres humanos, este procedimiento permitió identificar las diferentes 
formas en las cuales el virus se podría dispersar y al estar relacionado 
con un tipo de neumonía atípica (Mojica-Crespo y Morales-Crespo, 
2020), se planteó el aislamiento, el uso de mascarillas y las cuarentenas 
como las acciones inmediatas para evitar la multiplicidad de los con- 
tagios. Lo siguiente fue el reconocimiento mismo del virus, su forma, 
las maneras mediante las cuales es capaz de ingresar al organismo y los 
mecanismos que activa para afectar al cuerpo, al estar vinculado con 
una neumonía, se tomó en consideración la afectación, principalmente 
del aparato respiratorio. El hecho que sea un virus perteneciente a la 
familia “Nidovirus”, hace que pueda llegar a las personas, procedente 
de animales como los murciélagos y por otros humanos. 


Lo primero que se debía hacer, es establecer la forma del virus 
para poderlo reconocer en el cuerpo humano. Como se esperaba, se 
pudo encontrar que tiene la estructura habitual del SARS-CoV, con un 
conjunto de salientes que le hacen ver como una “corona”, tal como se 
puede ver en la figura 14. Estructuralmente el SARS-CoV-2 tiene cuatro 
proteínas estructurales principales que incluyen: las glicoproteínas de 
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pico (S), las glicoproteínas de envoltura pequeña (E), las glicoproteínas 
de membrana (M) y la proteína nucleocápsida (N), además de otras 
proteínas accesorias (Astuti, 2020; Jiang et al., 2020). 


Figura 14 
Estructura del virus SARS-CoV-2 


— Spike 


E Protein 


Nota. https://doi.org/10.1016/j.dsx.2020.04.020 


La glicoproteína S “Spike” se encuentra en la parte más externa 
del virus, facilita la unión de los virus de la envoltura a las células 
huéspedes por atracción con la enzima convertidora de angiotensina 
2 (ACE2) que aparece en las células del tracto respiratorio inferior. 
La proteína N es el componente estructural del CoV y participa en 
el ciclo de replicación viral y la respuesta de las células huésped a las 
infecciones virales. La proteína M “Matrix” juega un papel importante 
en la determinación de la forma de la envoltura del virus, ya que es 
capaz de unirse a todas las demás proteínas estructurales, además de 
promover el ensamblaje viral al estabilizar el complejo N de la proteína 
RN. Por último, la proteína E es la más pequeña de todas y se encarga 
de la producción y la maduración del virus (Shoeman y Fielding, 2019). 


Al momento en el cual el virus entra en la célula huésped, el SARS- 
Cov2 se une, al receptor ACE2, a las células alveolares de tipo II (AT2) 
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de los pulmones, a la parte superior del esófago y a las células epiteliales 
estratificadas, pero también a otras células como los enterocitos absor- 
bentes del colon, los colangiocitos, las células del miocardio, las células 
del túbulo proximal del riñón y células uroteliales de la vejiga (Xu et al., 
2020). Por ello, el virus no ataca solo al sistema respiratorio provocando 
el Síndrome de Dificultad Respiratoria Aguda (SDRA), sino que también 
aparecen trastornos en el corazón, los riñones y el tracto digestivo. 


El virus en el aire o en superficies 


De lo que se ha podido encontrar en la literatura a lo largo de 
la evolución de la pandemia, se ha podido hallar que el virus, se puede 
mantener en las superficies durante períodos largos de tiempo y que 
también puede permanecer suspendido en el aire, principalmente 
en espacios con aerosoles. Así, se ha encontrado que el virus puede 
presentarse en el fluido oral con una carga viral de hasta 7x10% copias/ 
mL (Wolfel, 2020) con tamaños mayores a los 4um, fluido que bien 
puede dispersarse por medio de un estornudo o una expectoración 
y que es capaz de mantenerse activo en diferentes superficies y de 
transmitirse por el contacto, principalmente de las manos, con dichas 
superficies y llevado dentro del organismo ya sea por la boca o los ojos. 
Esto motivó a que se intensificaran los procesos de limpieza en baños 
y áreas en general (Ding et al., 2021) y también que se masificara el 
uso del alcohol antiséptico para la limpieza continua de superficies y 
manos. Hoy en día y con las variantes del virus, se ha podido inferir, 
principalmente por simulación dinámica de fluidos, la presencia del 
virus en lugares con poca ventilación (Li et al., 2020); también se ha 
podido inferir la existencia del virus en el aire debido a que se le ha 
encontrado en los equipos de aire acondicionado de ambientes con 
personas contagiadas, encontrando partículas de SARS-Cov2 de entre 
1 y 4um con una carga viral ARN de entre 1.8 y 3.4 copias/m” (Ong et 
al., 2020) y en espacios con aerosoles (Chia et al., 2020). Sin embargo, 
el tiempo que puede mantenerse el virus, tanto en superficies como 
en el aire no ha podido ser determinado con precisión. 
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Acción del sistema inmune ante la presencia del virus 


Un aspecto interesante en el proceso de entrada del corona- 
virus al organismo ya sea por la boca, ojos o nariz, es que luego de 
haberlo logrado, sus características genéticas le permiten adherirse a 
las células por medio de la enzima convertidora de la angiotensina 2 
(ACE2) que actúa como receptor objetivo para el ingreso en una célula 
huésped (Pastrian-Soto, 2020; Montaño y Flores-Soto, 2020). Así, el 
virus es admitido dentro de la célula para luego replicarse de manera 
exponencial, se conoce que una sola partícula viral de SARS-CoV-2 
puede hacer hasta 100 000 copias de sí misma en 24 horas. 


Al tiempo que la primera partícula viral entra en una célula, se 
activa la “primera línea de respuesta” por medio de los macrófagos, 
que son células exterminadoras de patógenos. Los macrófagos encuen- 
tran al virus y lo engullen. Dentro de ellos, los lisosomas, orgánulos 
propios de los macrófagos, degradan el material intracelular del vi- 
rus, generando desperdicios (que en este caso están conformados de 
fragmentos de proteínas y ARN del virus) que sirven como “retratos” 
(antígenos) para que otras unidades especiales sepan reconocerlo y 
matarlo. Si la infección no es grave, con los macrófagos es suficiente 
para eliminar el virus. Cuando no consiguen vencer al invasor, los 
macrófagos producen citoquinas que son proteínas que controlan la 
inflamación. En este punto se sienten los primeros síntomas, tos, fiebre 
y malestar. Las citoquinas no actúan solo generando inflamación local, 
estas moléculas viajan por la sangre hasta otros órganos (Zaim et al., 
2020). En el hipotálamo influyen en el sistema termorregulador de la 
temperatura corporal, lo que produce fiebre, que es una función básica 
para lanzar una alerta general. En el hígado activan la producción de 
la proteína C reactiva que se encarga de encontrar células infectadas e 
iniciar el proceso para destruirlas o bien que ellas mismas se suiciden, 
y en la médula ósea activan la producción de más macrófagos para 
tratar de engullir a más partículas virales, pero esto conlleva a que a 
su vez se produzcan más citoquinas y por tanto más inflamación (Cao 
y Li, 2020), lo que puede contribuir a un círculo vicioso que acaba en 
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colapso. La primera línea de respuesta del organismo frente al virus 
se muestra en la figura 15. 


Figura 15 
Primera línea de respuesta del organismo frente al virus 
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Las células NK también forman parte de esta primera línea de 
respuesta del organismo y su misión es la localización y destrucción 
de células infectadas (Maucourant et al., 2020). 
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El sistema inmune aparte de macrófagos y citoquinas, cuenta 
con una segunda línea de respuesta que utiliza las células dendríticas 
como enlace entre las dos líneas de respuesta, engullen los “desperdi- 
cios” del virus y se los llevan por el sistema linfático hasta los ganglios, 
que es donde se producen citoquinas que activan los linfocitos T y 
B. Esta activación provoca que los linfocitos T citotóxicos, viajen a 
través del torrente sanguíneo y que lleguen al lugar de la infección 
para destruir las células infectadas. Así mismo, los linfocitos B se 
encuentran directamente con el virus o el antígeno y como hay mi- 
llones de variantes de linfocitos B, cada una tiene un tipo concreto 
de anticuerpo, que es como una llave. Cuando un linfocito B puede 
encajar su llave perfectamente en la cerradura del virus, comienza el 
proceso de fabricar miles de copias de sí mismo. Estos linfocitos se 
transforman después en células plasmáticas que viajan por la sangre 
a todos los tejidos, lanzando anticuerpos a todas las partículas virales 
que encuentre. 


Según la capacidad del sistema inmune para reaccionar a la 
replicación del virus, las personas contagiadas pueden presentar sín- 
tomas o no. Los casos que se complican y derivan en unidades de 
cuidados intensivos, son aquellos en los que se produce “la tormenta 
de citoquinas” que provoca procesos de inflamación para activar otras 
áreas del organismo para combatir al virus, sobrecargándolo con 
proteínas inflamatorias que acaban colapsando el sistema inmune y 
que puede provocar la muerte de la persona contagiada (Domínguez 
y Galocha, 2020). 


En búsqueda de la cura 


Al inicio todo era una opción 


Casi inmediatamente, al mismo tiempo que la pandemia se 
extendía alrededor del mundo, los laboratorios, las farmacéuticas y 
en general, los países empezaron a trabajar en la tarea de lograr una 
vacuna que logre erradicar a la enfermedad, o al menos, consiga dotar 
a la población de los anticuerpos suficientes que permitan disminuir 
la mortalidad provocada por el virus. Según el Instituto Internacional 
de Vacunas (IIV), en la historia, el tiempo que normalmente se ha 
requerido para el desarrollo de una vacuna ha oscilado entre los 5 a 
10 años (Serrano, 2020). 


Por este motivo, en un inicio, no se visualizaba en el horizonte 
a la vacuna como el arma clave para la erradicación de la enferme- 
dad. Esto incluso, a pesar de que dentro de la comunidad científica 
se realizaban estimaciones de que la vacuna para la COVID-19 se 
podría conseguir entre 12 y 18 meses (Sánchez, 2020) siempre que 
se otorgaran las correspondientes autorizaciones de emergencia sa- 
nitaria mundial. Se habló mucho de la “inmunidad de rebaño” (El 
Comercio, Redacción, 2021a), y particularmente, el Reino Unido lo 
anunció como estrategia para controlar el contagio y así luchar con- 
tra el virus (DeMiguel, 2020) a pesar de la crítica de la comunidad 
científica británica que indicaba que dicha estrategia aumentaría la 
presión sobre los sistemas de salud británicos y que arriesgaba la vida 
de las personas más de lo necesario (Ghosh, 2020). La inmunidad de 
rebaño, también conocida como inmunidad colectiva, se produce 
cuando existe un número suficiente de individuos que están prote- 
gidos frente a una determinada infección y actúan como cortafuegos 
que impiden que la enfermedad llegue a los que no están protegidos 


CHRISTIAN SALAMEA PALACIOS 


50 


(Gómez-Lucía y Ruiz-Santa, 2020). Para cuantificar el valor con el 
cual se puede decir que se ha alcanzado la inmunidad de rebaño, se 
utiliza la relación (1-1/Ro), donde Ro es el número de reproducción 
básica. Mientras más contagioso sea el virus, mayor va a ser el valor de 
Ro y también va a ser mayor la proporción de población que deberá 
ser inmune para bloquear la transmisión del virus. Se debe tener en 
cuenta que Ro depende de diversos factores, como la densidad y la 
estructura de la población. Con base en la información recogida de 
diferentes ciudades y países se pudo definir un Ro estimado de 3, con 
lo que el umbral de inmunidad de rebaño sería el 67 %, esto significa 
que la incidencia de la enfermedad empezará a disminuir cuando la 
proporción de personas con inmunidad adquirida superara ese 0.67 
(Randolph y Barreiro, 2020). Entendiendo que ese valor es aproxima- 
do, se empezó a manejar el criterio de que la inmunidad de rebaño 
se conseguiría si entre el 60 % y 70 % de la población superara la 
enfermedad. Sin embargo, a día de hoy, se ve como improbable de 
que se pueda conseguir dicha inmunidad (Martínez, 2021), debido 
a varios factores como: que no está del todo claro que las vacunas 
eviten la transmisión del virus, que los programas de vacunación en 
el mundo son desiguales, que las variantes cambien la ecuación de la 
inmunidad de rebaño y que la inmunidad puede no ser permanente. 
El panorama más probable contempla una 'nueva normalidad” donde 
la COVID-19 pase a constituirse en una enfermedad endémica, como 
la gripe (Navarro-Alonso, 2021). La humanidad tendrá que aprender 
a convivir con un virus que probablemente va a ir perdiendo fuerza, 
debido principalmente a las variantes, pero que en el corto plazo no 
parece que vaya a desaparecer (Aschwanden, 2021; Linde, 2021). 


En base con la información estadística inicial obtenida a partir 
de evaluaciones experimentales y referidos a las estimaciones de la 
Organización Mundial de la Salud, se estableció una tasa de mortalidad 
global de 5,7 % (Baud et al., 2020), es decir que, de cada 100 personas 
contagiadas, entre el 5 % y 6 % presentaría complicaciones graves, 
con una alta probabilidad de muerte. 
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En un inicio, no se contaba con ningún tratamiento médico para 
controlar o para curar la enfermedad, se utilizaban analgésicos para con- 
trolar el dolor y la temperatura, siempre manteniendo el criterio de que la 
COVID-19 es una enfermedad viral y por lo tanto, se debía únicamente 
ayudar al cuerpo para que soporte el paso del mismo. Los casos más 
graves se presentaban y se presentan, en su mayoría, por la incapacidad 
del sistema inmune de dar una respuesta adecuada a la eliminación del 
virus. Aunque las afecciones provocadas en el organismo son múltiples 
y en diferentes órganos, se manifiesta de manera más persistente en 
los pulmones, provocando su inflamación, la que impide que puedan 
obtener el aire que el cuerpo necesita para mantener el ciclo vital, tanto 
es así, que hubo más de un caso de personas que se desvanecían al no 
poder respirar, en esos tiempos, creció de manera muy importante el 
alquiler de tanques de oxígeno, utilizados para facilitar la respiración de 
los contagiados (Coba, 2020; Toche, 2021; Montevideo AFP, 2021). Los 
casos más graves, se les hospitaliza para una administración inmediata 
de oxígeno, o bien pueden requerir de un respirador artificial, cuya 
función es reemplazar la función de los pulmones hasta que los mismos 
se recuperen y que sean capaces de funcionar por si solos. Sin embargo, 
existe la alta probabilidad de que la inflamación de los pulmones no 
cese y que queden tan dañados como para no recuperarse en un futuro, 
con lo cual la persona no logra superar la enfermedad. 


En ese contexto, con la pandemia saturando los sistemas de 
salud de todos los países en el mundo y sin tener respuestas inmediatas 
por parte de la ciencia médica, empezaron a aparecer entusiastas que, 
en base de cierta pseudo-ciencia experimental, propusieron métodos 
para sobrellevar e incluso para curar la enfermedad. Entre los máximos 
exponentes estuvieron: el dióxido de cloro (CDS), la ivermectina y la 
hidroxicloroquina (hydroxychloroquine). 


El dióxido de cloro 


El dióxido de cloro (CDS) es un compuesto químico utilizado 
regularmente como desinfectante industrial para el tratamiento de aguas 
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(Bautista et al., 2021), consiste en una solución al 28 % de clorito de sodio 
en agua destilada. Desde hace ya varios años, viene publicitándose como 
remedio para una variedad de infecciones y enfermedades, sin embargo, 
ningún ente regulador sanitario lo reconoce como medicamento (Orgaz, 
2020) ya que no ha superado la fase toxicológica, lo que implica que 
no ha llegado a la fase de evaluación en seres humanos. La hipótesis no 
comprobada de su uso para el tratamiento de la COVID-19 surgió a 
partir del mecanismo de acción del CDS, con la que se cree que podría 
actuar neutralizando residuos de proteínas que están relacionadas con 
las que tiene el SARS-CoV-2, y se asumió que en una solución acuosa 
todos los residuos de proteína podrían actuar con el CDS del mismo 
modo que los aminoácidos libres, con lo que podría eliminar el SARS- 
Cov-2 (Merlo et al., 2020). Científicos de todas partes del mundo y en 
diferentes formatos, así como la Food and Drug Administration- FDA 
desaconsejan el uso de este compuesto para tratar la COVID-19. El uso 
no regulado de este compuesto para tratar la COVID-19 tuvo un impacto 
significativo en América Latina y principalmente en Ecuador y Perú, 
donde se han podido encontrar múltiples testimonios relacionados con 
la utilidad de este compuesto en la cura de la enfermedad (Orgaz, 2020). 
En Ecuador, se presentaron varias iniciativas sociales que reclamaban la 
aprobación del uso del dióxido de cloro para tratar la COVID-19, como 
la llevada a cabo en Santo Domingo de los Tsáchilas (Velasco, 2020), 
incluso existió un pedido firmado por diez de los 30 obispos del Ecua- 
dor al presidente de entonces, Lenín Moreno, para que autorice el uso 
del dióxido de cloro a pesar de que la Agencia de Control y Vigilancia 
Sanitaria (ARCSA) de Ecuador ya había llamado a la población a que 
se abstenga de adquirir y consumir productos químicos relacionados, 
como el clorito de sodio (ARCSA, 2020), ya que al no poseer registro 
sanitario ecuatoriano, no se podía garantizar su seguridad, calidad y 
eficacia, por lo que representaba un riesgo para la salud de la población. 
Su consumo podía y puede producir dolor abdominal, náuseas, vómitos, 
diarrea, intoxicaciones o fallo renal (AFP, Redacción, 2020). 


Este compuesto y su uso para la cura de enfermedades en seres 
humanos fue promovido por Andreas Kalcker, científico alemán, pio- 
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nero del uso del dióxido de cloro (CDS) con fines médicos. Kalcker 
participó, junto con la Asociación que preside, la Asociación Ecuato- 
riana de Médicos Expertos en Medicina Integrativa (AEMEMI) en la 
Comisión de Fiscalización de la Asamblea Nacional del Ecuador el 9 
de julio de 2020 con el objetivo de proponer al Ministerio de Salud 
Pública el consumo de CDS como alternativa para tratar la COVID-19. 
En dicha sesión Kalcker manifestó que tenía evidencia de que 6000 
pacientes se habían curado de COVID-19 sin efectos secundarios a 
base del CDS, afirmaba que no existe evidencia o efectos secundarios 
negativos por su consumo en cien años, además indicó que el CDS 
aumentaba en un 50 % el oxígeno en las personas enfermas y que eso 
les ayudaba a superar la enfermedad. Dicha evidencia se sustentaba 
en un supuesto ensayo llevado a cabo en Guayaquil entre el 27 de 
marzo y el 10 de abril de 2020, en 104 voluntarios de entre 18 y 80 
años, incluyendo en el estudio a personas con pruebas positivas de 
COVID-19 y a personas que estuvieron en contacto con las personas 
infectadas. Sin embargo, el estudio no contó con la comparación de 
otro tratamiento o con un grupo de control, lo que llevó a que no se 
pudiera garantizar la precisión del mismo. En general, la comunidad 
científica ha venido advirtiendo que el producto no es apto para el 
consumo humano y cuestionaba las acciones de los asambleístas de 
dar espacios tan importantes al análisis de prácticas pseudocientíficas 
(Ecuador Chequea, 2020; Mostajo-Radji, 2021). 


No existe abundante evidencia científica que respalde, que re- 
chace o que brinde un análisis profundo acerca del uso de dióxido 
de cloro para el tratamiento de SARS-CoV-2 (Bautista et al., 2021), 
seguramente debido a que el CDS no ha superado la fase de evaluación 
de toxicidad en los ensayos clínicos (Merlo et al., 2020) y por ello ni 
siquiera llegó a probarse en seres humanos. Con la producción de 
las vacunas y su distribución alrededor del mundo, no se ha vuelto 
a hablar del CDS para el tratamiento de la COVID-19. Sin embargo, 
antes de la aparición de las vacunas, hubo unos cuantos artículos 
científicos que abordaron la temática del uso de CDS para tratamiento 
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de la COVID-19. Lo que más se acerca a estudios científicos en torno 
a la temática, se tienen: 


En el respaldo al uso en humanos, se puede encontrar lo pro- 
puesto por Insignares (et al., 2020) en la Revista de Medicina Molecular 
y Genética, donde se concluye que el CDS es eficaz en el tratamiento 
de la COVID-19, además de proponer los mecanismos de acción por 
lo que actúa para conseguirlo. O el análisis llevado a cabo por Liester 
(2021) donde se concluye que la ingesta de CDS es segura siempre y 
cuando se traten de dosis pequeñas, las dosis mayores pueden producir 
efectos hemorrágicos y renales. En un ámbito más neutral se pueden 
encontrar trabajos basados en revisiones sistemáticas, como en el caso 
de Burela (et al., 2020) donde se concluye que no hay evidencia científica 
que apoye el uso de CDS para tratar o prevenir la COVID-19. Lo que 
más se puede encontrar son conclusiones negativas del uso del CDS 
en humanos, como lo expone Arellano-Gutiérrez (et al., 2021) donde 
asocia efectos como la perforación intestinal asociada a la ingesta de 
CDS y positivas de su uso como desinfectante (Morino et al., 2011). 
Conclusiones positivas relativas al CDS se pueden encontrar cuando se 
le utiliza como desinfectante, en ese contexto se tiene el estudio realizado 
por Hatanaka (et al., 2021) donde se afirma que el CDS es un potente 
agente antiviral contra el SARS-CoV-2, incluso mejor que el hipoclo- 
rito de sodio, o el estudio realizado por Zhao (et al., 2021) donde usa 
el CDS para proceso de esterilización de ambientes utilizando robots. 


Como conclusión, en relación con el tema del CDS y el contexto 
actual de la pandemia, en ningún caso se recomienda el uso de CDS 
para el tratamiento de la COVID-19, menos aún ahora que se cuentan 
con vacunas que han superado exitosamente todas las fases propias 
de un ensayo clínico. 


La ivermectina 


La ivermectina es un agente antiparasitario de amplio espec- 
tro aprobado por la FDA (González, et al., 2008) y la OMS, se utiliza 


EN BÚSQUEDA DE LA CURA 


55 


ampliamente en la medicina veterinaria como antiparasitario para 
tratar la sarna o los piojos. Al ser un antiparasitario económico y efl- 
ciente, en menores dosis, también se ha utilizado en humanos con el 
mismo objetivo. De estudios como los de realizados por (Caly et al., 
2020 o Gupta et al., 2020), aunque en fase experimental in vitro, se 
comprobó la efectividad de la ivermectina para inhibir la replicación 
del SARS-CoV-2, por medio de la inhibición de la importación nu- 
clear de huéspedes y de proteínas virales, limitando la infección por 
virus ARN, tal como el virus DENV 1-4, el virus del Nilo Occidental, 
el virus de la equinencefalitis venezolana o la gripe. En este sentido, 
también se han encontrado inhibiciones importantes sobre proteínas 
propias del SARS-CoV y entendiendo que SARS-CoV-2 es un virus de 
ARN estrechamente relacionado con el SARS-CoV, se sugiere que la 
actividad inhibidora del transporte nuclear de la ivermectina podría 
actuar eficazmente contra el SARS-CoV-2 (Chahla y Medina, 2020; 
Pandey et al., 2020). Khan (et al., 2020) llevaron a cabo un proceso de 
experimentación en el Mymensigh Medical College Hospital de Ban- 
gladesh durante abril y junio de 2020, con 325 pacientes confirmados 
PCR de COVID-19, de los cuales 115 recibieron ivermectina, 133 un 
placebo y los restantes 77 quedaron fuera del experimento debido a 
que eran menores de edad. A partir de los resultados del experimento, 
Khan et al. (2020) sugieren que la ivermectina puede considerarse 
como un tratamiento de primera línea eficaz para contener el virus 
y para prevenir complicaciones respiratorias severas e irreversibles, 
así como para evitar la trasmisión comunitaria. En la misma línea, 
Ahmed (et al., 2020) proponen incluso un tratamiento definido con 
ivermectina para tratar a la COVID-19 con la posibilidad real de 
reducir la duración de la enfermedad. 


Sin embargo, la OMS, desaconsejó usarla para tratar la CO- 
VID-19 (OMS, 2021a) debido a que no existían pruebas concluyentes 
sobre la eficiencia de la ivermectina para el tratamiento de la enfer- 
medad. También la FDA intervino en esta misma línea, indicando 
que la ivermectina no ha demostrado ser ni segura ni eficaz para el 
tratamiento de la COVID-19. La aprobación de la ivermectina dentro 
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de la medicina para tratar a seres humanos está orientada a tratar 
únicamente la estrongiloidiasis, la oncocercosis intestinal y algunas 
afecciones cutáneas (FDA, 2021). Sin embargo, previo a esta resolución 
de la OMS, algunos países habían considerado ya la posibilidad de 
incluir a la ivermectina dentro del protocolo para tratar la COVID-19. 
Ese fue el caso de Perú, donde el Ministerio de Salud, mediante Reso- 
lución Ministerial 270-2020-MINSA, publicado el 8 de mayo de 2020, 
incluyó dentro su protocolo, el uso de la ivermectina para casos leves, 
moderados y graves de COVID-19 (Ministerio de Salud de Perú, 2020). 
Luego de casi un año de vigencia de esta resolución, la ivermectina 
dejó de prescribirse y de contar dentro del referido protocolo para el 
tratamiento de la enfermedad (El Peruano Redacción, 2021) llegando 
a imponer sanciones a los proveedores de ivermectina con fines de 
curar la COVID-19 (Andina Redacción, 2021). 


En lo que respecta al Ecuador, el Ministerio de Salud Pública ha 
indicado en todo momento que no existen pruebas concluyentes de 
que la ivermectina favorezca la recuperación de pacientes COVID-19 
y que por esa razón la desaconseja (Veletanga, 2021). Por su parte, la 
Agencia Nacional de Regulación, Control y Vigilancia Sanitaria (ARC- 
SA), el 9 de febrero de 2021 comunicó que, ante la alta promoción 
y demanda de medicamentos que contienen ivermectina en el país, 
para tratar pacientes COVID-19, recogiendo las conclusiones de la 
Sociedad Ecuatoriana de Farmacología (SEF) y del Consenso Multi- 
disciplinario de Tratamiento de la COVID-19, quienes determinaron 
que no hay suficiente evidencia científica en favor o en contra del 
uso de la ivermectina para tratamientos COVID-19, no recomendó 
su uso en ninguna fase de la enfermedad. En base de estos criterios, 
dispuso que las farmacias debían solicitar la receta médica obligatoria 
para la venta al público de medicamentos que contengan ivermectina 
(ARCSA, 2021a). 


Sin embargo, varios meses atrás de estas recomendaciones, 
el Municipio de Guayaquil había adquirido grandes cantidades de 
ivermectina para lo que denominaron Plan de desparasitación en la 
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ciudad de Guayaquil. Según lo expuesto en (Ponce, 2021), en abril de 
2020 ya se habían adquirido 60 000 tabletas del compuesto y para enero 
de 2021 se habían adquirido 23 666 tabletas más. Según declaraciones 
de la alcaldesa de Guayaquil de entonces, Cinthya Viteri, el plan de 
desparasitación comunitaria continuaría y que si acaso no ayuda a 
combatir el virus de la COVID-19 por lo menos iba a desparasitar a 
las personas (Paucar, 2020). Todo esto antes de que el ARCSA haya 
dispuesto una normativa para el no uso del medicamento para tra- 
tamientos COVID-19. Lo anterior indica que la ivermectina estuvo 
siendo utilizada en el Ecuador y puntualmente en la ciudad de Gua- 
yaquil de una manera masiva y sin control por parte de las entidades 
regulatorias como el MSP o el ARCSA. Esto conllevó a que tampoco 
se cuente con información de los resultados que se pudieron haber 
obtenido, no se va a poder saber si acaso este plan masivo de distri- 
bución de ivermectina a la población pudo haber favorecido o no la 
evolución de la pandemia, al menos en Guayaquil. Con lo ocurrido, 
se perdió lo que pudo haber sido una oportunidad para conocer las 
implicaciones reales de este fármaco en relación con el virus y de sus 
ventajas o desventajas de uso. Sin embargo, más allá de lo acontecido, 
tanto, en Ecuador, como en Perú y otros países en Latinoamérica, lo 
que es seguro es que la ivermectina presentó alguna evidencia científica 
más allá de lo propuesto para el uso del CDS, con lo que fue un paso 
adelante en la búsqueda de la cura del virus en situaciones realmente 
complicadas, con los sistemas de salud colapsados y con una dispersión 
del virus a gran nivel. De seguro ninguno de estos métodos constituía 
una opción adecuada ni conveniente para el tratamiento de la enfer- 
medad, pero a nivel de sociedad y frente a la nada, constituían una 
esperanza, un arma para luchar contra la enfermedad, lo importante 
en esos momentos era evitar la muerte, y en ese contexto, cualquier 
otro riesgo constituía una opción viable. 


La hidroxicloroquina 


Este compuesto fue el primer acercamiento farmacéutico utili- 
zado para el tratamiento de la enfermedad, incluso algún jefe de esta- 
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do llegó a asegurar que se encontraba tomando la hidroxicloroquina 
(HCQ) para combatir al virus (BBC Redacción, 2020c) llegando pos- 
teriormente a defender el uso de esta a pesar de las recomendaciones 
de las agencias de control de su no utilización (Corona, 2020). Antes 
de la aparición de las vacunas no existía un tratamiento eficaz contra 
el coronavirus, responsable de la COVID-19, y la tendencia era utilizar 
fármacos antivirales e nmunomoduladores, donde los antimaláricos 
como la cloroquina y la hidroxicloroquina fueron de las alternativas 
más estudiadas (Lasheras y Santabárbara, 2020). Sin embargo, los 
efectos adversos resultaban controversiales dada la gravedad que pre- 
sentaban, ya que podían presentar complicaciones a nivel de la retina 
o del miocardio, puntualmente con la aparición de arritmias graves tal 
como demuestran estudios realizados en torno al tratamiento de otras 
enfermedades (Tselios et al., 2018). Sin evidencia científica que conclu- 
yese la utilidad de la HCQ, se siguieron protocolos conservadores que 
pudieran, en posible, minimizar los efectos adversos descritos, debiendo 
ser aplicada principalmente a casos leves. Debía suministrarse lo más 
pronto posible luego de ser diagnosticado la COVID-19, se aplicaban 
tratamientos agudos de cinco días y se realizaban electrocardiogramas 
previos al inicio del tratamiento para reducir el riesgo de complicaciones 
de los pacientes, entre otras medidas (Cairoli y Espinosa, 2020). En otras 
partes del mundo, concretamente en Francia, un equipo de investiga- 
dores utilizó también la HCQ, pero combinada con la azitromicina, 
que se utilizaba para evitar una sobreinfección bacteriana, lo curioso 
fue que encontraron una reducción significativa de la enfermedad en 
aquellos que utilizaron la combinación (Cochrane, 2020). 


Por su parte, la Organización Panamericana de la Salud sugería 
la no utilización de la HCQ para personas con COVID-19 y que podría 
considerarse una alternativa terapéutica solo para pacientes críticos, 
mayores de sesenta y cinco años, que cursasen una neumonía grave o 
una infección respiratoria en progresión (OPS, 2020b). 


Ya en lo que respecta al Ecuador, en (Serrano, 2020) se pue- 
de encontrar un estudio donde se intentó definir la eficacia de la 
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combinación de la HCO y la azitromicina para tratar casos leves a 
moderados de COVID-19, llegando a concluir que no se evidenció 
una diferencia significativa en el resultado clínico entre los grupos 
creados para evaluar el rendimiento del tratamiento (Cavalcanti ef 
al., 2020). Hasta que el 27 de mayo de 2020, el Ministerio de Salud 
Pública emitió un comunicado donde apoyó la decisión de la OMS de 
suspender el uso de la hidroxicloroquina, como tratamiento para la 
COVID-19, sustentado seguramente por diferentes experiencias que 
empezaron a compartirse a través de la comunidad científica. Entre 
dichas experiencias, se pueden exponer algunas, como la del estudio 
científico francés que resaltaba que el uso de HCQ era ineficaz y que 
podría derivar en una mayor mortalidad de pacientes con COVID-19, 
y otras como la publicada en el artículo de la revista Lancet (April, 
2021), donde se reveló que no hubo beneficio en el resultado final del 
tratamiento de la enfermedad y más bien, se encontró un aumento en 
la tasa de mortalidad (Ministerio de Salud Pública, 2020). 


La llegada de las vacunas 


Desde la aparición del virus las farmacéuticas estuvieron aten- 
tas a los avances científicos a nivel mundial para poder iniciar, desde 
una mejor posición, la carrera para la producción de una vacuna que 
cure la COVID-19. El reconocimiento del virus y el estudio de su 
composición fueron aspectos prioritarios que permitieron que dichas 
empresas se planteen un tiempo mínimo de dos años para tener una 
vacuna que, esperaban, sería medianamente eficaz para contrarrestar 
el virus. Luego de tener un panorama claro de la estructura del virus, 
cada laboratorio tomó una estrategia particular para combatirlo, se 
fueron conociendo avances de la gigante Pfizer, que en conjunto con 
el laboratorio alemán BioNTech, había apostado por una solución 
basada en el componente genético del ARN mensajero para introdu- 
cir información genética de las características del virus con el fin de 
que el sistema inmune genere los anticuerpos con antelación y pueda 
proteger a la persona en el momento de recibir al virus real. 
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También fueron conocidas las intenciones de los investigadores 
de la Universidad de Oxford de producir una vacuna utilizando el virus 
disminuido. Por otra parte, también se conoció de la producción de la 
vacuna rusa Sputnik, nombre tomado en referencia al programa espacial 
ruso que lanzó cuatro naves para demostrar la viabilidad de los satélites 
artificiales en órbita terrestre. Luego de estas, apareció la información 
de que otros laboratorios también habían iniciado con la fase de pro- 
ducción y pruebas de una vacuna para combatir a la enfermedad, de 
las cuales, algunas son conocidas y utilizadas hoy en día y otras no han 
logrado sobrepasar el límite mínimo como para ser consideradas como 
eficaces para la protección contra la COVID-19. De entre ellas, tenemos 
las producidas por laboratorios chinos, principalmente, la SINOVAC 
que ha sido ampliamente utilizada en el plan de vacunación de nuestro 
país. En esta sección se va a abordar las características fundamentales 
de las vacunas que más se están utilizando hoy en día y de lo que se va 
conociendo en relación con su tiempo de protección y la eficacia. 


La vacuna basada en el ARNm 
(Pfizer-BioNTech, Moderna) 


La tecnología utilizada para la elaboración de vacunas de Pfizer 
y Moderna es la basada en la molécula ARN mensajero monocate- 
nario. Ha sido utilizada debido a su gran respuesta protectora en 
modelos animales contra algunas infecciones como la gripe, el ébola, 
el zika o incluso contra cierto tipo de bacterias (Martínez-Espinoza y 
Ramírez-Vélez, 2021). También se han realizado ensayos clínicos de 
vacunas ARN contra ciertos tipos de cáncer. Otra y muy importante 
ventaja del ARN es su efecto inmunomodulador, que estimula el sis- 
tema inmune (López-Goñi, 2021). 


Específicamente hablando de la vacuna desarrollada por Pfi- 
zer-BioNTech, conocida como BNT162b2 o con el nombre genérico 
Tozinameran, se utiliza un ARNm creado en un laboratorio para 
enseñar a nuestras células a producir una proteína (o parte de ella) 
para desencadenar la respuesta inmunitaria de nuestro organismo. 
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El funcionamiento, tanto de esta vacuna como de la de Mo- 
derna, se basa en la información genética contenida en el ADN del 
núcleo de la célula en forma de una secuencia de nucleótidos. En el 
núcleo, el ADN transfiere dicha información a la molécula de ARN 
en un proceso que se le llama transcripción, así la secuencia de ADN 
se copia en forma de ARN. 


La vacuna está compuesta por un ARN mensajero que se ob- 
tiene a partir del virus SARS-Cov2, dicho ARN se encuentra envuelto 
en burbujas aceitosas hechas de nanopartículas de lípidos, lo que le 
ayuda a llegar sin problemas a las células sin que nuestras enzimas 
naturales las destruyan si se inyectaran directamente en el cuerpo. 
Cuando la vacuna llega a la célula, las burbujas de lípidos se fusionan 
y el ARN mensajero es liberado hacia dentro del núcleo, con lo que se 
inicia la lectura de su secuencia para ensamblar la proteína de espiga 
(S) y activar el sistema inmune de las personas vacunadas para la 
producción de anticuerpos neutralizantes específicos para este virus. 
La proteína de espiga (S) es propia del virus SARS-Cov2 y es la llave 
que utiliza el virus para infectar nuestras células. Esta proteína es 
obtenida a partir del virus y luego utilizada para extraer su secuencia 
genética (secuencia de nucleótidos), tal como se muestra en la figura 
16 Mediante esta secuencia, reproduce artificialmente dicha proteína 
sin el virus, y que es al final el contenido del ARN de las vacunas, para 
que pueda ser identificada por el sistema inmune. 


Luego de que se crean las proteínas, estas se van a expresar en la 
membrana de la célula por medio de ra-receptores (el MHC 1 y MHC 
II) y en ese momento van a atraer a células del sistema inmune, los 
linfocitos Tipo H y los linfocitos citotóxicos. Los linfocitos de Tipo H se 
activan y liberan citosinas, con lo que las células B del sistema inmune 
proliferan y se van a producir los plasmocitos que son las células del 
sistema inmune que producen anticuerpos, son estos anticuerpos los 
que serán capaces de reconocer al virus del SARS-CoV2 y destruirlo 
antes que ingresen a las células y se multipliquen. Por otra parte, están 
los linfocitos T-citotóxicos que al reconocer a los ra-receptores MCH I 
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van a liberar moléculas para destruir las células infectadas (Martínez-Es- 
pinoza y Ramírez-Vélez, 2021). Este proceso se muestra en la figura 17. 


Figura 16 
Creación de las proteínas de espiga (S) 
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A pesar de que esta vacuna ha funcionado bastante bien gracias 
a su alto grado de eficacia (cerca del 95 %) con la pauta completa, se 
ha visto que con el tiempo la inmunidad disminuye, siendo necesaria 
una dosis de refuerzo a los seis meses. Queda por verse aún si serán 
necesarias dosis de refuerzo en el futuro para el caso de que la inmuni- 
dad disminuya o que nos encontremos frente a cepas más contagiosas 
y de rápida dispersión como la ómicron (Simó, 2022). 


Según la literatura, este tipo de vacuna de ARN mensajero, 
independientemente de que sea la producida por Pfizer o por Mo- 
derna, se han identificado algunos casos raros de miocarditis (Kounis 
et al., 2021; Starekova et al., 2021) y pericarditis principalmente en 
adolescentes y adultos jóvenes, aproximadamente a una semana de la 
inoculación y hasta veintiún días después, tal como lo describen Luk 
(et al., 2021) para casos estudiados en Canadá. 


En torno a las implicaciones de la vacuna de Pfizer en Ecuador, 
fue la primera en arribar al país, el 20 de enero de 2021 en un avión 
comercial a la ciudad de Quito, el primer lote estuvo constituido por 86 
000 dosis, las cuales se aplicaron en la Fase O del plan de vacunación en 
el país propuesto por el Gobierno de Lenín Moreno. Plan que presentó 
serias deficiencias en su diseño y en su ejecución, lo cual provocó la 
reacción de la población y de la Asamblea Nacional, la que exigió al 
presidente Lenín Moreno la destitución del cargo del entonces Ministro 
de Salud, Juan Carlos Zevallos (El Comercio, Redacción, 2021b) debido 
al manejo del plan de vacunación para la COVID-19 y al conocerse 
las decisiones tomadas por el entonces ministro para vacunar primero 
a sus familiares (BBC, Redacción, 2021a). La renuncia irrevocable de 
Zevallos se conoció el 26 de febrero de 2021 (BBC, Redacción, 2021b) 
por carta enviada directa al presidente de la República. La Fase O con- 
sistía en inocular al personal de salud de primera línea de atención 
médica, adultos mayores de centros geriátricos y al personal encargado 
de su cuidado (Ministerio de Salud Pública, 2021a). 


Resultaron llamativas las especificaciones técnicas de conser- 
vación de estas vacunas. Primero porque necesitaban mantenerse 
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a temperaturas sumamente bajas, en el orden de los -86” Celsius 
(Ministerio de Salud Pública, 2021c) para garantizar la fiabilidad 
del compuesto, y dado que Ecuador no tenía implementado en sus 
centros de salud, ni los equipos ni los espacios para contar con dicha 
temperatura, los productores de la vacuna entregaron a Ecuador, en 
calidad de préstamo, los congeladores U7O7 que tenían la capacidad 
de almacenar componentes sanguíneos y muestras de laboratorio a 
dicha temperatura. Segundo, por la logística requerida, en el caso de la 
ciudad de Cuenca, el primer cargamento de apenas 390 vacunas llegó 
al Centro de Salud de Pumapungo el 21 de enero, en un camión de un 
Courier y custodiado por policías, además del contingente policial y 
del ejército apostado en la entrada del Centro de Salud, los gendarmes 
superaban la veintena de uniformados (El Universo, Redacción, 2021). 
Lo anecdótico del momento ocurrió cuando, al abrir el camión, se 
pudieron ver las vacunas en una única caja minúscula en una esquina 
del camión, el cual evidentemente estuvo sobredimensionado para el 
traslado de las dosis desde Guayaquil. Estas vacunas fueron destinadas 
a médicos de primera línea de Cuenca y Azogues, 54 para médicos de 
Solca, 162 para el hospital José Carrasco Arteaga (1ESS), 108 al hospital 
Vicente Corral Moscoso y 66 al Homero Castanier de Azogues. Con el 
pasar de los días y de las semanas, llegaron los siguientes cargamentos 
con las dosis de esta vacuna y fueron destinadas, principalmente, a 
personas vulnerables y adultos mayores. 


Para mediados de marzo de 2021, la Agencia Europea del Me- 
dicamento (EMA) estableció, en base de informes adicionales de 
laboratorio, que esta vacuna se podía conservar a temperaturas de 
entre dos y ocho grados centígrados, además de que podía permanecer 
almacenada hasta 31 días antes de ser utilizada (Arroqui, 2021). Con 
ello, disminuyeron y mucho las dificultades en el traslado y el alma- 
cenamiento de la vacuna, con lo que se pudo utilizar masivamente 
en las siguientes fases de vacunación, con un espectro más amplio en 
cuanto a las personas que pudieron acceder a ella. 
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La vacuna de Oxford (AstraZeneca) 


Esta vacuna nace de la asociación de la Universidad de Oxford 
con la empresa de origen británico-sueca llamada AstraZeneca para 
producir, en conjunto, una vacuna contra la COVID-19. Al igual que 
la vacuna de Pfizer, se basa en procedimientos genéticos que posibi- 
litan la creación y replicación de células con la forma del virus SARS- 
Cov-2 con el fin de estimular al sistema inmune para que genere los 
anticuerpos necesarios para combatir la infección. Específicamente 
hablando, se basa en las instrucciones genéticas del virus para cons- 
truir la proteína de S (de espiga), pero a diferencia de las vacunas de 
Pfizer o Moderna, no utilizan el ARNm sino el ADN de hélice doble. 
Esta proteína en forma de espiga es la que le permite al SARS-CoV-2 
adherirse a las células humanas y lo que se busca es neutralizar la 
acción de estas espigas. Lo que hace la vacuna de Oxford-Astrazeneca 
es utilizar el adenovirus modificado de chimpancé para transportar el 
código genético de esta proteína de espiga hacia las células humanas. 
Cuando el organismo detecta a este organismo extraño, entonces 
se promueve la producción de una gran cantidad de antígenos que 
provoca una respuesta inmune, de tal forma que cuando la persona se 
encuentre con el virus verdadero, el cuerpo lo va a reconocer y estará 
listo para defenderse. 


El uso del adenovirus modificado de chimpancé utilizado por el 
equipo de la Universidad de Oxford para la producción de la vacuna 
llevó al primer nombre que se le otorgó a la misma: “ChAdOx1”. Sin 
embargo, hacia marzo de 2021, en medio de una crisis de reputación 
de la vacuna debido a casos de trombosis detectados en varios países 
de la Unión Europea, que incluso llevó a interrumpir la vacunación 
en algunos de ellos; la farmacéutica Astrazeneca, solicitó a la Unión 
Europea el cambio de nombre comercial de la vacuna, con lo que 
comenzó a llamarse “VaxSevria” (Heraldo, Redacción, 2021). Según 
se supo, los portavoces de la farmacéutica manifestaron que el cambio 
de nombre comercial era un procedimiento habitual y había estado 
previsto desde hacía meses atrás (AFP, Redacción, 2021). Una diferencia 
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importante de esta vacuna con la de Pfizer o Moderna es que es más 
resistente, el adenovirus tiene una cubierta resistente que protege el 
material genético que contiene, lo que le permite durar al menos seis 
meses si las condiciones de refrigeración se mantienen en tempera- 
turas de 2 a 8 “C según el prospecto, a diferencia de las vacunas que 
utilizan el ARNm (mucho más frágil) que, en un principio, requerían 
de temperaturas de -80 *C. 


Su principio se basa en el método denominado “vector viral” que 
consiste en añadir el gen de la proteína de espiga (S) del coronavirus 
dentro de otro virus llamado adenovirus. Los adenovirus son virus 
comunes que generalmente producen resfríos o síntomas similares 
a los de una gripe. La característica principal del adenovirus es que 
puede entrar en las células, pero no puede replicarse en su interior. 
Este adenovirus es el que fue modificado en el laboratorio, eliminando 
los genes originales y reemplazándolos con el gen de la proteína S del 
SARS-CoV-2, dado que el coronavirus original está repleto de este 
tipo de proteínas y es precisamente por esta proteína que se le llama 
coronavirus, tal como muestra la figura 18. 


Figura 18 
El ADN de doble hélice dentro de un adenovirus 
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El adenovirus, que es básicamente el contenido de la vacuna, se 
introduce en el cuerpo y se adhiere a las células. Estas, lo envuelven en 
una burbuja y lo atraen a su interior, ahí, el adenovirus escapa de la 
burbuja y viaja hasta el núcleo, donde está el ADN de la célula. Cuando 
llega el adenovirus al núcleo, introduce su ADN en este último y el 
gen de la proteína S del coronavirus puede ser leído por la célula y 
copiado en las moléculas ARNm. Como se muestra en la figura 19. 


Figura 19 
Transformación del ADN en el ARNm en el núcleo de la célula 
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Ya en este momento se pueden construir las proteínas S, el 
ARNm sale del núcleo, las moléculas de la célula leen su secuencia 
y comienzan a ensamblar las proteínas S. Algunas de estas proteínas 
forman espigas que migran a la superficie y extienden sus puntas, tal 
como se muestra en la figura 20. En este contexto, el sistema inmune, 
y particularmente, las células inmunitarias llamadas linfocitos B, van 
a chocar con las espigas del coronavirus en la superficie de las células 


CHRISTIAN SALAMEA PALACIOS 


68 


vacunadas y en ese momento, van a secretar anticuerpos que atacarán 
a la proteína S. Los anticuerpos podrán adherirse a las espigas del 
coronavirus, marcarlo para que sea destruido y bloquear la infección 
al impedir que las espigas se adhieran a otras células. 


Figura 20 
Formación de las proteínas tipo espiga 
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Por otra parte, el adenovirus como tal, también estimula al sis- 
tema inmunitario activando los sistemas de alarma de la célula, estos 
envían señales de alerta para activar las células inmunitarias cercanas. 
Al activar esta alarma, la vacuna Oxford-AstraZeneca hace que el sis- 
tema inmunitario reaccione con más fuerza a las proteínas de espiga. 


Luego de los ensayos clínicos correspondientes se llegó a deter- 
minar una eficacia del 63 % con una dosis contra la infección sinto- 
mática de la enfermedad (OMS, 2022) y hasta un 82,4 % de eficacia 
cuando se administraban dos dosis con un intervalo de 12 semanas 
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(Corum y Zimmer, 2021). Así que, aunque en un principio se pensó 
en la vacuna de AstraZeneca como una opción monodosis, la baja 
eficacia llevó a que se constituya en una vacuna con dosis de refuerzo. 


Ya hablando sobre la vacuna de AstraZeneca en el Ecuador, en 
octubre de 2020, el Ministerio de Salud Pública suscribió un contrato 
de aproximadamente cinco millones de dosis con la farmacéutica As- 
traZeneca. Sin embargo, la autorización de importación que emite el 
ARCSA fue generada el 22 de enero de 2021 (ARCSA, 2021b). A partir 
de esa fecha, en diferentes cargamentos han venido llegando dichas 
dosis para ser inoculadas a la población ecuatoriana. Ya sea a través de 
la iniciativa COVAX (Harrison, 2022; OPS, 2021), o también debido a 
que algunos países, principalmente de Europa, decidieron no utilizar 
esta vacuna dentro de sus planes de vacunación, se recibieron múltiples 
donaciones a lo largo del tiempo, como, por ejemplo, el Gobierno de 
México donó 1 millón de dosis (Vicepresidencia del Ecuador, 2021), 
Hungría donó 150 000 dosis (Primicias, Redacción, 2022), España 
entregó más de 100 000 dosis (OCHA, 2021), entre otros. La vacuna de 
Astrazeneca ha sido utilizada también para la segunda y tercera dosis 
de refuerzo en el país dentro del plan de vacunación, será de esperar 
a que se cumplan los plazos de inmunidad sugeridos para conocer, 
si se va a inocular este tipo de vacuna en las siguientes campañas de 
vacunación de dosis de refuerzo. 


La vacuna Sinovac 


Es la tercera de las vacunas que el Gobierno Ecuatoriano pasado 
y el actual ha adquirido para inocular masivamente a su población. Di- 
señada y fabricada por los laboratorios Sinovac LifeScience con sede en 
Beiging-China, utilizó la tecnología de los virus inactivados como base 
para combatir la pandemia provocada por el SARS-Cov2. Con base en los 
ensayos clínicos desarrollados ha conseguido hasta un 91 % de eficacia 
cuando se completan dos dosis de 0,5 ml cada una con un intervalo de 
14 a 28 días (OMS, 2021b). Al igual que la vacuna de Oxford-AstraZe- 
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neca, la conservación de esta vacuna es relativamente sencilla, ya que se 
mantiene estable a una temperatura de entre 2 y 8 ? centígrados. 


La producción de una vacuna en base de virus inactivado se 
fundamenta en el uso de células muertas de un virus cuya capacidad 
de infección es nula, pero que, sin embargo, su forma le permite al 
organismo, activar su sistema inmune y producir los anticuerpos 
necesarios para estar preparado en un caso de que apareciera el virus 
real. Para lograr esto, los científicos chinos tomaron células de riñones, 
específicamente del epitelio renal de “monos verdes” de África para 
reproducirlas de manera masiva y por ello, también se les llama “células 
de cultivo”. A cada una de estas se les inyecta el virus SARS-CoV-2 y se 
les deja incubar. Luego de la incubación, se les inactiva mediante un 
procedimiento bioquímico donde se utilizan varias sustancias, como 
la denominada Betapropiolactona entre otras. Lo que se consigue con 
este procedimiento es “matar” al virus, lo que significa que pierde la 
capacidad de infectar y de replicarse, pero no pierde la capacidad de 
generar anticuerpos. Esta tecnología es la más conocida de entre las tres 
vacunas presentadas, dado que es relativamente común que se utilice 
para otras enfermedades como la polio, la rabia o la misma influenza. 
Sin embargo, es una vacuna con uno de los índices de eficacia más 
bajos obtenidos luego de los ensayos clínicos de tercera etapa llevados a 
cabo en Brasil con porcentajes entre el 50,7 % y el 62,3 % en pacientes 
sintomáticos (Owen, 2021). Estos resultados, comparándolos con los 
obtenidos con las vacunas de Pfizer o AstraZeneca, han provocado que 
columnistas como Owen Dyer sugirieran a las autoridades chinas la 
mejora de la calidad de sus vacunas y de la manera de administrarlas 
debido a la poca efectividad de estas. 


Sobre los efectos de la vacuna, al igual que las otras vacunas, 
se han presentado efectos secundarios como dolor en la zona de la 
inoculación, fiebre y en muy pocos casos, urticaria. También se han 
detectado efectos muy raros, como, por ejemplo: sordera (Zhao et al., 
2022), trombosis (Hameed, et al., 2022) o vasculitis cutánea (Bencha- 
rattanaphakhi y Rerknimitr, 2021). 
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Eso sí, llama la atención que solo de la vacuna china Sinovac 
se encuentran más informes negativos, incluido uno de la OMS mos- 
trando detalladamente en documentos oficiales todo el procedimiento 
seguido para la obtención de la vacuna, como si no se hubiesen fiado 
del mismo. 


Además de las vacunas de Pfizer-BioTech, Oxford-AstraZeneca 
y Sinovac, existen otras vacunas producidas por otros laboratorios, 
como, por ejemplo, la Sputnik de Rusia, la Cansino o Johnson « Jo- 
hnson de Estados Unidos. Sin embargo, no se ha realizado un análisis 
detallado de cada una debido a que no están autorizadas para ser 
utilizadas en el Ecuador y no nos son familiares los casos ni tampoco 
el fenómeno social generado o las implicaciones de salud de estas en 
la población ecuatoriana. 


El diagnóstico de la enfermedad 


Métodos de diagnóstico 


Uno de los principales problemas con el virus SARS-Cov2 es que 
se propaga fácilmente entre las personas, de una manera muy similar 
a la gripe o al resfriado común, por lo que detectarlo tempranamente 
es de vital importancia para prevenir su propagación (Deeks et al., 
2020, Shaikh et al., 2020). Por ello, es necesario que las pruebas mé- 
dicas tengan una alta sensibilidad y especificidad, es decir, deben ser 
capaces de identificar, con un alto índice de exactitud, los verdaderos 
casos positivos y los verdaderos casos negativos de contagio del virus. 
Así mismo, la identificación incorrecta de Covid-19, cuando no está 
presente (falso positivo), puede dar lugar a medidas incorrectas, como: 
iniciar un tratamiento o el aislamiento de la persona y de sus contactos 
cercanos, tratamiento médico innecesario, etc. (Valencia-Portilllo et 
al., 2020; Wálfel et al., 2020). 


Para el diagnóstico de la enfermedad se han venido utilizando 
métodos moleculares y serológicos. Si bien, dichos métodos permiten 
la detección de la Covid-19, su eficiencia está relacionada al tiempo de 
infección del individuo y a la calidad misma de las pruebas (Cassaniti 
et al., 2020; Hoffman et al., 2020). En la figura 21 se puede observar la 
sensibilidad de las pruebas que utilizan métodos moleculares (PCR) 
y serológicas (Ig M, Ig G), o pruebas rápidas, con respecto al inicio 
de la infección. 


Como se puede observar, las pruebas moleculares son las úni- 
cas capaces de detectar a un paciente antes de presentar síntomas; 
sin embargo, esta eficiencia disminuye conforme avanzan los días de 
contagio. Por otra parte, las pruebas serológicas tienen un alto índice 
de detección a partir de la segunda semana, es decir, que la exactitud 
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de las pruebas, para detectar esta patología, depende del tiempo en 
que se la realiza (Schróder et al., 2016; Singh et al., 2016). Esto difi- 
culta mucho el diagnóstico, pues en algunas ocasiones las personas no 
conocen cuándo fueron infectadas y se vuelve complejo determinar 
la mejor opción para diagnosticarlo, pudiendo generar pérdidas de 
recursos o dando falsos negativos, en personas contagiadas (Cassaniti 
et al., 2020). 


Figura 21 
Curva de eficacia de métodos moleculares y serológicas desde el inicio de la 
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Nota. Imagen tomada de (Valencia-Portillo et al., 2020). 


En este sentido, una de las principales recomendaciones de la 
OMS, para controlar la pandemia, ha sido el testeo de toda la pobla- 
ción, para localizar los focos de contagio y realizar un aislamiento 
efectivo, tareas que no se han cumplido por diversos factores, más en 
países como el nuestro dónde la capacidad operativa y económica es 
limitada. En este escenario, es imprescindible multiplicar los esfuer- 
zos por determinar métodos “innovadores” de diagnóstico, que sean 
gratuitos y de libre acceso para la población. 


En el momento más álgido de la pandemia, cuando el aumento 
de casos a nivel mundial era incontrolable, la OMS publicó el primer 
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protocolo de la prueba de reacción en cadena de la polimerasa, con 
retrotranscripción (PCR-RT), para diagnosticar el nuevo coronavirus 
(OMS, 2020) siendo incluso hoy en día, el método más confiable y 
ampliamente usado (Giri et al., 2020). A partir de esa fecha, se fueron 
proponiendo diversos mecanismos para diagnosticar la enfermedad, 
principalmente utilizando, la sangre de los posibles contagiados, la 
saliva y los flujos nasales, en otros casos (Sheikhzadeh et al., 2020). 
En la continua búsqueda de metodologías para determinar focos de 
contagio que ayudasen a tomar medidas de contención del virus, se 
llegó a encontrar trazas de rste en los desechos sólidos humanos. Este 
particular ha servido para obtener información valiosa relacionada con 
la pandemia, como la identificación de focos de contagio o el momento 
de aparición del virus en diferentes partes del mundo. Por ejemplo, 
en Italia, dicha evidencia ha sido utilizada para seguir el rastro del 
coronavirus en el tiempo y para detectar focos de infección del virus 
(Magenta, 2020). Incluso, se ha llegado a diagnosticar la COVID-19 
por medio de muestras de heces; en enero de 2021, se conoció que 
principalmente en Asia y puntualmente en China se llegaron a utilizar 
test anales (AFP y NBSP, 2021), como pruebas rápidas de diagnóstico 
del virus (OPS, 2020c). 


Un enfoque de ingeniería para el diagnóstico 
de la enfermedad 


Como se puede ver en (Yiice et al., 2021), existen métodos de 
diagnóstico de la COVID-19 de todo tipo, entre ellos: los basados 
en características clínicas (termómetros), los basados en test de la- 
boratorio (hematológicos, bioquímicos, de coagulación de sangre, o 
biomarcadores inflamatorios), los basados en cambios patológicos en 
los órganos de los pacientes, los basados en moléculas inmunológicas, 
los basados en el ácido nucleico viral y los basados en antígenos (Ab- 
delhamid et al., 2021). Entre todos ellos, unos terminan siendo más 
confiables y precisos que otros. Más allá de los métodos diagnósticos 
descritos, se puede notar que la gran mayoría están fundamentados 
en un análisis biológico, probablemente porque la sensibilidad de este 
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tipo de pruebas resulta lo suficientemente confiable para determinar 
la presencia o no del virus. Sin embargo, desde la ingeniería y con la 
inteligencia artificial, se empezó a proponer alternativas para tratar 
de diagnosticar la enfermedad, principalmente porque la pandemia 
requería de soluciones en el corto plazo que permitieran la contención 
del virus. En este contexto, la gran cantidad de información que se 
podía obtener debido al inmenso número de contagios diarios hacía 
que la minería de datos y la inteligencia artificial fueran alternativas 
tentadoras para obtener conocimiento acerca del virus. Desde un punto 
de vista general, se tenía, por una parte, la dificultad de detectar el virus 
sin un análisis biológico de por medio, y, por otra parte, se conocía 
ya de la potencia de los sistemas automáticos de reconocimiento, con 
buenos resultados en tareas tan complejas como el reconocimiento 
de voz o de rostros. 


Tomando como idea principal el uso de sistemas automáticos 
de reconocimiento para un posible diagnóstico de la enfermedad, lo 
primero que se tenía que hacer era definir los parámetros de entrada 
para dichos sistemas automáticos. Esta entrada, evidentemente, debía 
contener la información extraída de los síntomas propios de la enfer- 
medad. Una adecuada valoración de estos en personas contagiadas iba 
generar un diagnóstico con una probabilidad alta de acierto. 


Según lo que se ha encontrado en la literatura, hoy en día se uti- 
lizan evidencias indirectas de la enfermedad para realizar valoraciones 
cualitativas de la presencia o no de la enfermedad. Por ejemplo, las 
radiografías de tórax son fundamentales para valorar el diagnóstico 
de COVID-19 visualmente, permitiendo determinar el alcance de la 
enfermedad y el correspondiente tratamiento. Por otra parte, y ya 
entrando en materia de aplicaciones con aprendizaje automático, en 
(Hammouadli et al., 2021) se presenta una aplicación informática basada 
en técnicas de “Deep Learning” para analizar de manera automática 
las radiografías de pecho y valorar la presencia o no de neumonía, lo 
que da un acercamiento a la posibilidad de existencia de COVID-19. 
En otros trabajos como (Jain et al., 2020), se da un paso más allá y 
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se utilizan las radiografías de pecho en sistemas también de “Deep 
Learning” con la aplicación de redes neuronales convolucionales para 
valorar la presencia de COVID-19. También se ha intentado recurrir 
al ultrasonido de pulmón para conocer si existe algún patrón ca- 
racterístico con la aparición del virus, encontrándose características 
vinculantes, como las que se describen en (Soldati et al., 2020). 


El uso de la tos como herramienta para la detección 


Como se ha dicho anteriormente, la información de entrada a 
los sistemas automáticos inteligentes para obtener un diagnóstico de 
COVID-19 que existen en la literatura, está basada en los síntomas 
típicos de la enfermedad: fiebre, tos, dolor de cabeza, pérdida del olfato 
y el gusto, cansancio general, dolor de las articulaciones, entre otras 
(Wiersinga, et al., 2020; Calica et al., 2020). Entre todos estos, desde 
un inicio, los médicos tratantes de la COVID-19, comentaban de un 
sonido típico de lo que era una tos COVID-19. Normalmente ha sido 
catalogada como una tos seca que no genera flema y que provoca una 
sensación de cosquilleo en la garganta (Dasgupta, 2021). El “Sonido 
característico” podría representar un patrón de la tos COVID-19. Si 
bien es cierto que este tipo de tos puede darse debido a otro tipo de 
patologías y que no tiene que estar relacionada con la COVID-19, sí 
que permite segmentar aquellas patologías donde la tos no es seca. 
A partir de ello, se puede explorar, que tanto pueden aprender las 
máquinas en relación con el patrón de tos. 


A la señal de tos se le puede tratar como un espectro de frecuen- 
cia y extraer sus parámetros “cepstrales” para que sirvan de entrada de 
un sistema de clasificación inteligente. Los parámetros denominados 
“cepstrales” se definen como la Transformada de Fourier del logaritmo 
de la magnitud del espectro de una señal de voz (Oppenheim y Schafer, 
1975), y son ideales para procesar señales de audio y de habla debido a 
que, por una parte, son muy específicos para las bajas frecuencias que 
es el rango donde se encuentran las frecuencias del sonido y de la voz 
y por otra, son muy generalistas en las altas frecuencias. Esto permite 
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que cualquier elemento característico de la voz pueda ser detectado y 
extraído eficientemente, posibilitando una clasificación eficiente. Con 
estos parámetros, se pueden proponer diferentes alternativas para tratar 
de diagnosticar COVID-19 a partir de la señal de tos. Laguarta et al. 
(2020) proponen un sistema inteligente de clasificación de una señal 
Covid-19 a partir de grabaciones de tos realizadas desde un teléfono 
celular como mecanismo preliminar de detección de la enfermedad. 
Esta detección preliminar serviría de insumo para conocer de primera 
mano quien o quienes deberían realizarse una prueba de confirmación 
de contagio. En ese mismo sentido, Subirana (et al., 2020) plantean el 
mismo enfoque, y así como con el teléfono celular se puede detectar 
una canción en base únicamente de su sonido, se propone que utili- 
zando algoritmos de inteligencia artificial como Transfer Learning, 
se podría entrenar sistemas computacionales para que sean capaces 
de reconocer si una grabación de tos representa un diagnóstico de 
COVID-109. En este caso y con el objetivo de obtener una base de datos 
suficiente para el entrenamiento de sistemas automáticos, Subirana 
et al. presentaron el programa OpenSigma para recopilar las graba- 
ciones de tos donadas por la ciudadanía, generar una base de datos 
importante y entrenar sistemas inteligentes para realizar valoraciones 
de diagnóstico de COVID-19 positivo o negativo. La Universidad de 
Cambridge también propuso esta línea de investigación como un 
aporte valioso al estudio de la COVID-19, y así Mascolo (Brown et 
al., 2020) ha recopilado una base de datos de grabaciones de tos para, 
mediante algoritmos de inteligencia artificial, dar una valoración sobre 
la presencia o no de COVID-19. 


Todas estas referencias, dan cuenta de las iniciativas, que alre- 
dedor del mundo, se han dado para aportar desde el punto de vista de 
la ingeniería a la lucha contra la COVID-19, habiéndose encontrado 
un nicho importante en la tarea de diagnóstico de la enfermedad 
mediante sistemas telemáticos que podrían posibilitar la obtención 
de un diagnóstico sin una prueba física y sin el traslado de los posibles 
contagiados a lugares con aglomeraciones, condiciones que favorece- 
rían la contención del virus. 
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Sin embargo, se debieron considerar las siguientes restricciones 
para determinar que señales audibles de tos eran susceptibles de uso 
en la tarea de reconocimiento y las que no, todas las restricciones se 
han ido considerando en base de las buenas prácticas llevadas a cabo 
por los diferentes grupos de investigación que, alrededor del mundo, 
trabajaron paralelamente en la misma idea. 


Las restricciones que se han considerado en la toma de muestras 
han sido: 


+ Fumadores y asmáticos. Se considera que la tos provocada 
por fumadores o por asmáticos puede muy bien confundirse 
con una tos COVID, al coincidir en los elementos esenciales 
como, la sequedad (Shaker et al., 2020). 

+ El tiempo de contagio. La permanencia del virus en el cuerpo 
involucra una carga viral que se puede representar como una 
función gaussiana normal, es decir, al inicio hay una carga 
viral mínima, la que, al pasar de los días pasa a un valor 
máximo para finalmente volver a disminuir hasta desapa- 
recer, este fenómeno ha marcado el tiempo que las personas 
con diagnóstico positivo deben estar en aislamiento. Con la 
aparición de nuevas cepas, se ha llegado a modificar incluso 
el número de días de aislamiento dado que la carga viral 
aparece y desaparece en plazos diferentes. Por estas razones, 
se considera al tiempo de contagio como un factor esencial 
para establecer una hipótesis de la carga viral presente en 
la persona quien busca saber si su tos se corresponde o no 
con una tos COVID. 

+ El género. Existe evidencia epidemiológica que sugiere que 
el género masculino se ve más afectado por el SARS-CoV-2 
que el femenino (Costeira ef al., 2021), requiriendo mayor 
hospitalización y con una tasa de mortalidad más alta, por 
lo que ha sido imprescindible incluir este dato en las res- 
tricciones para posibles futuros estudios. Por otra parte, 
el género constituyó una restricción clave para el sistema 
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de reconocimiento propuesto, dado que a la tos se le trató 
siempre como una señal de voz, y dentro de la estructura de 
estos sistemas, es necesario establecer un tipo de evaluación 
para voces masculinas como femeninas dadas las diferencias 
implícitas en la producción del sonido. Dependiendo del 
tamaño de la base de datos conseguida, se podría asegurar 
la eficacia del procedimiento y del modelo si se crean los 
modelos considerando que la tos ha sido producida por un 
hombre o por una mujer. 

» La edad. Con el mismo criterio anterior, la voz va cam- 
biando conforme avanza la edad, debido principalmente a 
las variaciones morfológicas del tracto vocal en la etapa de 
crecimiento de los niños y adolescentes. Por ello, se restringe 
el uso de la aplicación a personas con mayoría de edad y por 
debajo de los 65 años, ya que a partir de esta edad también 
se producen cambios significativos en la voz de las personas. 

+ Certificado Positivo. Uno de los mecanismos utilizados para 
garantizar que la información enviada para el entrenamiento 
de los sistemas automáticos sea confiable, es requerir a los 
usuarios que indiquen si poseen una prueba RT-PCR con 
resultado positivo, constituyéndose en un aspecto clave en las 
restricciones del sistema en general, dado que las muestras 
de tos no certificadas, en principio, no serían útiles para la 
tarea de entrenamiento. 


Todas las restricciones descritas fueron recogidas mediante un 
banco de preguntas propuesto a los “donantes de tos” y almacenadas 
como metadatos dentro de la base de datos donde también se almacenó 
la señal acústica de la tos. Así, con la información recogida a partir de 
las restricciones del sistema, se espera disminuir el margen de incer- 
tidumbre presente al momento de la toma de decisión. 


En este sentido, se recalca que la herramienta propuesta para 
la caracterización de una tos COVID-19 (que se corresponde como 
un estudio descriptivo transversal exploratorio), no implica aún el 
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diagnóstico de las personas que tienen COVID 19, sino más bien, la 
extracción de las características propias de una tos COVID analizada 
a partir de la señal de audio proporcionada por los participantes. 


La propuesta de detección de una tos COVID-19 


En torno a temas relacionados con la pandemia, en el Ecuador 
y en la mayor parte de Latinoamérica, estuvimos siempre expectantes 
de las soluciones y respuestas que llegaban desde el primer mundo. 
Estados Unidos, Europa y la misma China, empezaron a trabajar en 
la identificación del virus, en los mejores métodos para el diagnóstico 
y en la creación de una vacuna contra la COVID-19. En el país, las 
respuestas frente a la pandemia aparecieron, en su mayoría, desde la 
ingeniería. Se conocieron de iniciativas para producir respiradores 
artificiales, que se esperaban que fueran utilizados por personas con 
grave pronóstico (Universidad Politécnica Salesiana, 2020; Paucar, 
2021). También se conoció de iniciativas en la construcción de tú- 
neles de desinfección para el acceso de lugares de alta concurrencia 
(Benalcázar, 2020). Sin embargo, no parecía probable de que el país 
pudiera afrontar, mediante programas y líneas de investigación cien- 
tífica, el reto del diagnóstico y menos aún, el de encontrar una cura 
de la enfermedad. 


Desde las primeras noticias que aparecieron acerca de la apari- 
ción del virus y de su inminente escalada global, consideré necesario 
e imprescindible, estudiar tecnologías telemáticas que permitieran 
resolver la problemática del diagnóstico de la enfermedad. Esto con 
el fin de aliviar un poco la carga de llevar la pandemia en un entorno 
de bajos ingresos económicos como el del Ecuador, donde una prue- 
ba PCR costaba 120 USD con un salario mínimo vital de 400 USD y 
donde el trabajo informal supera el 50 % y por ende, el pan de cada 
día es precisamente eso, el trabajo del día, imposible de pensar en 
fondos de reserva para encerrarse y esperar a que el sistema de salud 
tenga la capacidad de resolver los casos que requiriesen atención mé- 
dica y hospitalaria. En la época más dura de la pandemia, no se sabía 
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cuál sería el desenlace de esta, no se tenían certezas de la aparición 
de la vacuna y menos de una hipotética inmunidad de rebaño. La 
ciudadanía empezó a experimentar en su cuerpo con compuestos 
químicos como el dióxido de vloro, o medicinas como la ivermectina. 
En este contexto, parecía ideal empezar a trabajar en una propuesta de 
diagnóstico telemático de la enfermedad, utilizando uno o más de sus 
síntomas más comunes. Se podría llegar a contar con una aplicación 
web que estaría disponible en ordenadores y en teléfonos celulares, y 
mediante la cual, se podría captar la señal audible de tos para valorar 
si esta se corresponde con una tos tipo COVID-19. Esto, si bien, no 
garantizaría un diagnóstico 100 % fiable, dado que la aparición de la 
tos puede deberse a un número muy significativo de enfermedades 
que no serían precisamente COVID-19, sí que podría constituirse 
en una herramienta de diagnóstico preliminar y en un mecanismo 
útil para segmentar los focos de contagio y proponer aislamientos 
planificados, sin ninguna exposición de las personas no contagiadas 
y con el aislamiento y descanso necesario de las personas contagiadas. 


La tarea de utilizar los patrones del sonido de la tos para la clasi- 
ficación constituye una tarea muy compleja dentro del punto de vista 
del procesamiento digital de señales y del reconocimiento de patrones, 
principalmente por la alta variabilidad de una señal de audio en el 
tiempo, más aún, al hablar de un patrón como la tos, que, en principio, 
es muy similar al sonido de un chasquido o de un golpe repentino. 
Por esta razón, no se concibe al sonido de la tos como el sonido a 
analizar, sino que se utiliza una “secuencia de tos”. Una secuencia de 
tos se define como el conjunto de expectoraciones que se producen a 
partir de una primera inhalación de aire hasta la siguiente (Piirila y 
Sovijavi, 1995). Normalmente, se producen tres o cuatro sonidos de 
tos dentro de una secuencia, este conjunto de toses es el que se utiliza 
para intentar la identificación de un patrón más característico que el 
que se puede encontrar con una sola expectoración. En la siguiente 
figura 22 se muestra una representación del fenómeno de la secuencia 
de tos, en ella se pueden distinguir tres expectoraciones, estas empie- 
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zan a producirse a partir de la apertura de la glotis y culminan con la 
siguiente inspiración de aire. 


Figura 22 
Representación de una secuencia de tos 
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Ahora, si bien las secuencias de tos se pueden definir como un 
patrón más característico para un proceso de clasificación que una sola 
expectoración, aún constituye un reto importante, el procesamiento 
de una señal de audio que, como se ve en la figura 22, presenta una 
muy alta variabilidad a lo largo de su aparición, lo que dificulta la 
identificación de secciones estables de la señal y por ende imposibilita 
el uso de filtros analógicos/digitales o la aplicación de técnicas como 
la de Fourier para el procesamiento. Por esta razón, se propuso tratar 
a la señal de tos como si fuera una señal de voz, lo que posibilitaría el 
uso de las técnicas relacionadas con el procesamiento automático de 
habla y el procesamiento de lenguaje natural. 


La formalización del proceso como un proyecto 
de investigación 


Planteamiento de la propuesta 


Como se ha dicho anteriormente, la hipótesis consistió en plan- 
tear que la señal audible de la tos, al igual que la voz, podría ser con- 
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siderada como una señal cuasi-estacionaria si es que era analizada a 
nivel de trama, y de esta manera, se tendría la posibilidad de encontrar 
mediante procedimientos matemáticos, patrones característicos de 
la misma. Por otra parte, basados en los conceptos de la inteligencia 
artificial, se intuyó que si estos parámetros eran utilizados con un 
enfoque de aprendizaje automático, la máquina iba a tener la capa- 
cidad de abarcar las características de los diferentes tipos de tos para 
diferentes condiciones de obtención de la señal, siempre que se cuente 
con una base de datos suficientemente grande que esté constituida 
por un universo diverso de “donantes de tos”, tanto de diagnóstico 
positivo como de diagnóstico negativo. 


Con este objetivo, se consideró prioritario el diseño y la imple- 
mentación de un sitio web que permitiese a la ciudadanía en general, 
“donar” su tos y que la misma fuera almacenada en una base de datos 
estructurada, la que serviría luego como entrada para los sistemas 
automáticos de detección. Con esta idea en mente, era pertinente 
buscar e identificar que otras aplicaciones similares se podrían estar 
generando alrededor del mundo, dado que la pandemia no era y no es 
un asunto local, ni nacional, sino más bien, global. De esta manera, se 
encontraron los trabajos de Mascollo de la Universidad de Cambridge 
y de Laguarta en el Instituto Tecnológico de Massachusetts (MIT) que 
concebían una idea similar, la obtención de señales de tos de la ciu- 
dadanía por medio de aplicaciones informáticas que, a distancia y en 
base con la señal de la tos emitida por una persona en un dispositivo 
móvil o en un ordenador, se determina si la misma corresponde a un 
diagnóstico positivo de la enfermedad. 


Al constatar que instituciones de tanta importancia, como el 
MIT o la Universidad de Cambridge, habían considerado también 
la misma idea, existió la convicción de que se podía trabajar en una 
propuesta a nivel local o incluso nacional para catalogar una tos emi- 
tida telemáticamente por un usuario, ya sea, como una tos COVID o 
una tos no-COVID, sin proponer como objetivo al diagnóstico de la 
enfermedad, sino al reconocimiento de la tos. 
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Lo primero fue diseñar e implementar la página web que ser- 
viría de plataforma para que los usuarios pudieran “donar” su tos 
junto con una serie de metadatos que servirían para validar las señales 
audibles como candidatas de ser analizadas. Esto, porque las toses 
de personas fumadoras o asmáticas deben quedar fuera del análisis 
dada su correlación con las toses provocadas por la COVID-19. Tal 
como se menciona en (Shaker et al., 2020), tanto, la tos seca como la 
dificultad de respirar son síntomas comunes en ambos casos y para 
el caso del reconocimiento de la COVID-19, deben aislarse, dado que 
bien pueden representar falsos positivos. 


Para el desarrollo de la página web se utilizaron herramientas de 
libre uso y para la base de datos se contó con el espacio y la capacidad 
computacional de la Corporación Ecuatoriana para el Desarrollo de la 
Investigación y la Academia (CEDIA), quienes facilitaron su contin- 
gente para el desarrollo de este proceso de investigación científica. Por 
esta razón, varios de los procesos de experimentación se llevaron a cabo 
en dichos servidores, además de que la base reposa en los repositorios 
de dicha institución. Por otra parte, el dominio de la aplicación fue 
otorgado por la Universidad Politécnica Salesiana y así la URL de la 
aplicación se definió como: https://databasecovid19.ups.edu.ec/. 


Luego de la implementación de la página web y de la fase de 
pruebas preliminares de funcionamiento, correspondía realizar todas 
las campañas de difusión posibles, con el fin de dar a conocer a la ciu- 
dadanía de la idea propuesta y de invitarla a participar del proyecto, 
tanto en cuanto, dependíamos de esa respuesta para lograr una base 
de datos significativa en el contexto de su aplicación en sistemas de 
aprendizaje automático. Lo primero fue la elaboración de un video 
tutorial de uso de la aplicación, el cual reposa también en la página 
web montada y que puede ser consultado por toda persona que accede 
a la aplicación web (figura 23). 


Luego se realizaron actividades de difusión masiva dirigidas a la 
ciudadanía, mediante la asistencia a reportajes y entrevistas periodísti- 
cas. También, se invitó a medios digitales de comunicación y a medios 
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escritos para darles a conocer la idea y que la misma se difundiera en la 
población para motivarla a “donar” su tos. El impacto de esta medida 
fue significativo dado que se consiguió un incremento importante de la 
base de datos en los días siguientes a las entrevistas. Sin embargo, em- 
pezó a generarse el efecto de desbalance de la base de datos, dado que la 
mayoría de “donaciones” llegaba de personas con diagnóstico negativo 
de la enfermedad. Por ello, se buscaron alternativas para incrementar la 
base de datos y se buscaron alianzas para consolidar la idea de desarrollo 
como un proyecto de investigación formal. Se iniciaron contactos con 
diferentes Universidades del país para invitarles a participar de todo el 
proceso, tanto en la colaboración para incrementar la base de datos, 
como para el desarrollo técnico-científico de la idea de caracterizar una 
tos COVID por medio de sistemas de aprendizaje automáticos. 


Figura 23 
Video tutorial de uso de la aplicación web 
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La obtención de financiamiento 


En la búsqueda de investigadores e instituciones de educación 
superior que se interesasen en la propuesta, se encontró la respuesta 


EL DIAGNÓSTICO DE LA ENFERMEDAD 


87 


positiva de investigadores de la Escuela Politécnica Nacional y de la 
Pontificia Universidad Católica del Ecuador, con quienes se conformó 
el siguiente equipo de trabajo: 


Por la Universidad Politécnica Salesiana —Christian Salamea, 
Fernando Chica y David Romero. Por la Escuela Politécnica Nacional 
—Tarquino Sánchez, Xavier Calderón, Jessica Reina, David Naranjo y 
Paulo Castañeda. Por la Pontificia Universidad Católica del Ecuador 
—Javier Guaña. 


El equipo de trabajo en su conjunto, liderado por la Universidad 
Politécnica Salesiana, elaboró la propuesta de proyecto denominado 
“Caracterización de la tos provocada por la COVID-19 en pacientes 
con diagnóstico positivo” y se presentó en la Convocatoria de fondos 
concursables para investigación CEPRA-XV organizada por CEDIA. 
La evaluación de las propuestas fue realizada por pares externos, lo 
que garantizaba la transparencia del proceso. Al final, la propuesta de- 
sarrollada por los investigadores de las tres instituciones, en conjunto, 
fue aceptada en noviembre de 2020 y fue acreedora del financiamiento 
necesario para el desarrollo del proyecto de investigación. El proyecto 
tuvo una duración de un año calendario y se llevó a cabo de enero 
a diciembre de 2021, más tres meses de extensión del proyecto, que 
sirvieron para la explotación de los resultados de investigación. 


Los productos de investigación generados 


A raíz del proyecto de investigación desarrollado, se generaron 
varios productos científicos, entre ellos, cuatro artículos de congreso, 
las memorias del proyecto y el software en fase de producción para 
la caracterización de la señal audible de tos COVID-19 en pacientes 
de diagnóstico positivo. 


En cuanto a los artículos de congreso, tres de ellos han sido ya 
publicados, mientras que un cuarto ha sido aceptado para publicación. 
El primer artículo de congreso publicado se denominó Effects of data 
augmentation on the identification of cough sound using convolutio- 
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nal neural networks (Naranjo et al., 2021) y fue presentado en el VII 
Congreso Internacional de Ciencia, Tecnología, e innovación para la 
Sociedad CITIS 2021, obteniendo el reconocimiento de mejor artículo 
en el track de Science, Technology and Innovation for Information and 
Telecommunications. El segundo artículo de congreso fue Cough sound 
identification an approach based on ensemble learning (Salamea-Palacios 
et al., 2021) que fue presentado en el 2021 International Conference on 
Marketing and Technologies. El tercer artículo de congreso publicado 
fue Noise pattern definition methodology for noice cancellation in coughs 
signals using an adaptive filter y se presentó en la 5th International 
Conference on Intelligent Human Systems Integration: Integrating 
People and Intelligent Systems (IHSL, 2022). Mientras que el último 
artículo aceptado para publicación en el 20' LACCEI International 
Multi-Conference for Engineering, Education and Technology, es 
Modelos de aprendizaje automático para caracterizar la señal de tos en 
pacientes con COVID-19. En cada uno de ellos se puede encontrar 
información técnica más específica relacionada con los resultados de 
la investigación llevada a cabo. 


En lo que se refiere a las memorias del proyecto, se ha generado 
un documento que compila todo el proceso técnico de desarrollo. 
Se describe, por una parte, la estructura de la página web y por otra, 
el funcionamiento de todos los sistemas de aprendizaje automático 
evaluados, así como los resultados obtenidos en la tarea de caracteri- 
zación de una tos COVID. 


Por último, se generó el software que integra, por una parte, el 
mejor sistema de preprocesamiento de la señal de entrada de audio y 
por otra, el mejor modelo conseguido en la fase de experimentación. 
Hablando propiamente del funcionamiento del sistema, en la entrada 
de este se recibe una señal de audio en formato .wav (que se corres- 
ponde con la señal audible grabada por los usuarios), para luego ser 
convertida a imágenes de espectrogramas. A estos espectrogramas se 
les elimina los espacios de silencio, de tal manera que solo quede la 
señal audible a tratar, para luego pasar por el sistema de detección de 
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tos no-tos y con ello separar las señales de tos de los otros sonidos que 
pudieran existir. Con todo este preprocesamiento, se obtienen imágenes 
de espectrogramas de tos, las cuales pasan al modelo que posibilita 
la caracterización de la señal de tos, ya sea como una tos COVID o 
como una tos no-COVID,. Esta última fase es la que permite conocer 
si el audio de entrada, primero, se corresponde con una señal de tos, 
y segundo, si esa tos se corresponde con una señal COVID. 


Estos han sido los productos de investigación tangibles genera- 
dos desde un punto de vista ingenieril para dar respuesta a la pandemia, 
más allá de ellos ha quedado todos los intangibles que van desde las 
competencias del trabajo en equipo hasta las habilidades para procesar 
señales de audio. Para acercar al lector a las técnicas utilizadas para 
realizar el reconocimiento de la tos, en el siguiente capítulo se van a 
abordar conceptos fundamentales del reconocimiento automático de 
habla y de los sistemas de aprendizaje automáticos utilizados. También 
se va a profundizar en las etapas de preprocesamiento y de modelado 
de la señal de audio utilizadas para la caracterización de la señal de 
tos, para finalmente mostrar y analizar los resultados obtenidos con 
la aplicación informática final. Como se ha mencionado anterior- 
mente, los detalles y pormenores técnicos de cada una de las etapas 
se las puede encontrar en las memorias del proyecto desarrollado, las 
cuales, en caso de que vayan a ser utilizadas para consultas y procesos 
de investigación sin fines de lucro, pueden ser solicitadas a csalameaO 
ups.edu.ec o csalameaO yahoo.com. 


El reconocimiento automático 
del habla (RAH) y los sistemas 
automáticos 


Conceptos fundamentales del RAH 


Las técnicas de procesamiento automático de habla, en un princi- 
pio, se definieron como procesos donde la ocurrencia de los eventos se 
correspondía con una estimación de probabilidad de ocurrencia y eso 
posibilitaba que el reconocimiento de patrones se pueda llevar a cabo 
con un nivel mesurado de incertidumbre. Con el pasar de los años y con 
la potenciación del aprendizaje automático y los sistemas End-to-End, 
las redes neuronales y la capacidad de procesamiento de ordenadores, 
GPUs, TPUSs, las técnicas de reconocimiento se concentran hoy en día, 
en la extracción adecuada de conocimiento de las señales de voz y la 
mejor representación de dichas señales (D"Haro et al., 2014), (Diez et 
al., 2013), para luego concentrarse en el uso de la técnica que mejor 
se adapte a los datos de entrada y que realice una clasificación óptima 
(Huang et al., 2018; Parthasarathy y Sundaram, 2021). 


En los casos donde se cuenta con un número casi infinito de 
datos disponibles, háblese del caso de YouTube, Wikipedia, Google 
y otros similares, hoy en día, se aplican técnicas End-To-End para 
el reconocimiento de patrones, sin importar demasiado un análisis 
pormenorizado de la señal de entrada que se pretende clasificar (Par- 
thasarathy y Sundaram, 2021). En cambio, en los casos más comunes, 
donde, si bien no son pocos datos los que se requieren y se debe contar 
con una base de datos consolidada y equilibrada, los sistemas más uti- 
lizados tienen la estructura de los sistemas de aprendizaje automático 
y están orientados a tareas de agrupamiento y clasificación de señales 
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voz. Los sistemas de aprendizaje automático están constituidos por 
dos etapas: una destinada al entrenamiento de un “modelo” y una 
segunda destinada a la evaluación de este. La primera etapa se enfoca 
en la creación de un modelo que represente adecuadamente a los 
datos de entrada y la segunda etapa se enfoca en el ajuste de dicho 
modelo y a la aplicación informática final, que servirá recibir y enviar 
información a los usuarios. 


Como ejemplo, se puede mencionar el proceso utilizado en las 
tareas de reconocimiento de idioma, donde, la fase de entrenamiento 
está destinada a la creación de “modelos de lenguaje”. Estos modelos 
van a contener las principales características de cada uno de los idiomas 
utilizados durante el entrenamiento. Así, si se quiere crear un modelo de 
lenguaje del idioma español, se deberá utilizar un sistema de aprendizaje 
automático, que bien podría ser una red neuronal, cuyos valores de 
salida se irán adaptando conforme ingresen nuevos datos de entrada. 
El conjunto total de datos de entrada, también llamado “corpus” y debe 
contener para el modelo de lenguaje en español, únicamente textos 
en dicho idioma. El modelo va a incluir todas aquellas características 
observadas en el corpus de entrenamiento, y en base de una buena ge- 
neralización, se podrá realizar una adecuada clasificación, la que estará 
basada en la coincidencia de algunas, y no de todas esas características. 


Con el modelo ya creado se pasa a una fase de evaluación, donde 
el modelo “entrenado” se compara con las señales de voz que se presen- 
ten en la entrada del sistema de aprendizaje automático elegido y de 
las cuales no se conoce su idioma. El resultado de la comparación será 
la de una distancia entre el modelo entrenado y la señal de entrada. A 
esta distancia se le llama l¡kelihood y brindará información indicando 
que tanto se parece la señal de entrada a la del modelo. Un valor muy 
bajo de likelihood indicará que efectivamente la señal de entrada se 
corresponderá con el modelo del idioma entrenado, mientras que un 
valor alto de l¡kelihood indicará que la señal de entrada no se corres- 
ponde con el modelo y por tanto no pertenece a dicha categoría, para 
el caso del ejemplo, la categoría es el idioma español. 
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La metodología descrita y dada su semejanza con la de los siste- 
mas automáticos, abre la posibilidad de utilizar sistemas de aprendizaje 
automático (Machine Learning) para las tareas de reconocimiento 
donde interviene el habla. 


Los sistemas de aprendizaje automático (Machine Learning), en 
general dentro del ámbito del reconocimiento de patrones, se vienen 
utilizando para múltiples tareas en diferentes ámbitos. En el ámbito 
que nos compete (el tecnológico), se han conseguido muy buenos re- 
sultados en el tratamiento de imágenes y de audio, pudiendo encontrar 
ya comercialmente explotadas, aplicaciones de reconocimiento facial 
para los primeros y aplicaciones de interacción persona-máquina para 
los segundos. Adentrándonos en estos últimos, podemos comprobar 
a diario el buen funcionamiento de los agentes de voz, como Alexa o 
Siri, los que, más allá de distinguir a las personas, tienen la capacidad 
de reconocer los parámetros esenciales de la voz y de ejecutar tareas 
con una precisión bastante alta. 


Si bien las señales de voz se definen como “no estacionarias” 
debido a su alta variabilidad en el tiempo, las tareas de reconocimiento 
de voz son posibles debido a que las señales de audio se tratan como 
si fueran cuasi-estacionarias y así pueden ser objeto de aplicación de 
técnicas de procesamiento de señales digitales para su caracterización 
y modelización. Para lograr que la señal de audio sea cuasi-estacionaria 
es necesario tomar la totalidad de la señal de voz y dividirla en tramas 
de pocos milisegundos (normalmente de 10 a 20 ms), en esta nueva 
condición, la señal de voz ya puede considerarse como cuasi-estacionaria 
y se le pueden aplicar procedimientos matemáticos, como la Trans- 
formada de Fourier y filtros digitales (Salamea-Palacios et al., 2013). 
Así entonces, por ejemplo, si a un archivo de audio de unos 2 seg se le 
divide en tramas de 20 ms, se van a generar 100 archivos y son estos 
100 archivos los que se procesan individualmente para luego volverse a 
unir (si se requiere) en un archivo de audio de 2 seg pero ya procesado. 


El procesamiento que se realiza a cada trama de 20 ms incluye, 
por una parte, un procesamiento en el dominio del tiempo y, por otra 
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parte, otro en el dominio de la frecuencia. Con los dos, lo que se espera 
es extraer la mayor cantidad de información característica del tipo de 
sonido encontrado en la señal. Lo primero que se lleva a cabo es el pro- 
cesamiento de la señal en el dominio del tiempo, se parte de la hipótesis 
de que la mayor cantidad de información correspondiente a la trama se 
concentra en la mitad de la misma, y en base de esta hipótesis, se aplica 
la técnica denominada “ventaneado” que consiste en multiplicar cada 
valor de la señal de la trama por una curva característica, maximizando 
los valores de la señal con los valores altos de dicha curva y minimizando 
los valores de la señal por medio de los valores bajos de la curva. 


De varias pruebas preliminares y de la literatura consultada 
(Bae et al., 2016), se ha podido comprobar que la curva que mejor 
resalta la información importante de la voz y que enmascara la menos 
importante, es la de Hamming. Cada una de las señales de trama, luego 
de pasar por el ventaneado Hamming, todas pasan a ser tratadas en el 
dominio de la frecuencia por medio de la Transformada de Fourier. De 
la aplicación de la Transformada de Fourier se obtienen los correspon- 
dientes espectros de frecuencia, a los cuales se les aplican los bancos de 
filtros ceptrales de Mel (Davis y Mermelstein, 1980), los cuales permiten 
obtener un número de coeficientes que representan eficientemente 
las señales de voz. A estos coeficientes se les denomina Mel Frequency 
Cepstral Coefficients (MFCCs) y son ampliamente utilizados en el 
tratamiento de señales de voz. Posteriormente se normalizan estos 
coeficientes de tal manera que sus magnitudes no resulten demasiado 
cercanas a cero y que pudieran considerarse como un cero compu- 
tacional, complicando los procedimientos matemáticos posteriores. 


Recordando que todo el cálculo hasta este momento se ha rea- 
lizado a nivel de trama, lo que se va a obtener con la aplicación de 
los bancos de filtros cepstrales de Mel, es un número específico de 
coeficientes (para el tratamiento de voz suelen usarse 13 coeficientes) 
en cada una de dichas tramas. Si se concatena la información de cada 
trama con sus respectivos coeficientes cepstrales, lo que se va a obtener 
es un “espectrograma” del audio ingresado. Este espectrograma va a 
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estar constituido por una imagen bidimensional (tiempo-frecuen- 
cia) que muestra el nivel de energía de la señal de audio a lo largo 
del tiempo. Este tipo de imagen posibilita el uso de herramientas de 
aprendizaje automático que conservan y aprovechan la información 
espacial existente en las imágenes, tal como las redes neuronales con- 
volucionales (Romero y Salamea-Palacios, 2019). 


La caracterización de la señal audible 
de tos como una tos COVID 


Sistema general 


A pesar de que hoy en día se pueden encontrar dentro de la lite- 
ratura varias aplicaciones que promueven el diagnóstico de COVID-19 
por medio de la tos (Popadina et al., 2021; Belkacem et al., 2021), en 
realidad y de manera objetiva, no parece que la tos constituya el patrón 
sustancial para determinar directamente un diagnóstico de la enferme- 
dad. Esto porque, primero, se conoce que hay un número significativo 
de personas contagiadas asintomáticas que no presentan tos y, segundo, 
se sabe que pueden existir personas contagiadas con síntomas propios 
de la COVID-19 como fiebre o pérdida del gusto, pero sin llegar a pre- 
sentar tos. Con estos factores, se puede intuir que una herramienta de 
diagnóstico directo no será lo más óptimo. Por otra parte, la aparición 
de diferentes cepas y variantes presentan nuevos retos en el diagnóstico 
de la enfermedad, esto porque, debido a las mutaciones propias del 
virus, se podrían presentar diferentes síntomas, con lo que una herra- 
mienta para diagnosticar la COVID-19 por medio de la tos puede verse 
restringida a un número reducido de personas, además de las dificul- 
tades para obtener un buen rendimiento de dicha herramienta. En ese 
contexto, lo óptimo sería desarrollar una herramienta de diagnóstico 
de la enfermedad donde se consideren ponderadamente los síntomas 
típicos de esta, síntomas que pueden cambiar según las cepas existentes 
y, entre ellos, también considerar a la tos. 


Por estas razones se ha visto pertinente que antes de trabajar en 
una aplicación web de diagnóstico de la enfermedad, en primer lugar 
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se debe llegar a reconocer una señal de tos provocada por la COVID-19 
sin que ello implique la emisión de un diagnóstico definitivo. De esta 
manera, se espera llegar a contar con una herramienta cuantitativa que 
permita saber en qué medida una tos puede representar la presencia 
de la enfermedad. Luego de ello, se puede proponer una herramien- 
ta diagnóstica integral, que involucre a otros síntomas y que utilice 
también a la tos en su valoración. 


En la literatura se puede encontrar sistemas de aprendizaje 
automático orientados al tratamiento del audio y al reconocimiento 
de la voz con un gran rendimiento (Carlander-Reuterfelt et al., 2020; 
Okuda y Shoda, 2018), y para nuestro caso, si se considera a la tos 
como una señal particular de la voz, se intuye que, la señal acústica 
de la tos COVID-19 va a tener determinadas características y que 
estas van a diferir de otros tipos de tos, con lo cual, se podría recono- 
cer dichas características y clasificar a una tos, ya sea como una tos 
COVID o como una tos no-COVID, dejando por fuera como se ha 
indicado anteriormente, los casos de personas fumadoras o con asma. 
Así, para el proceso de clasificación, se propuso el desarrollo de un 
sistema inteligente como el mostrado en la figura 24, donde se puede 
ver que la captación de la señal acústica de tos se puede realizar por 
medio del micrófono de un dispositivo móvil o de un ordenador, el 
archivo de audio íntegro se almacena en una base de datos destinada 
para el efecto, para luego ser procesado digitalmente, extrayendo sus 
características cepstrales y con ellas, estableciendo un modelo para la 
tos COVID y otro para la tos no-COVID. 


La captación de las señales de audio de tos se llevó a cabo 
de manera anonimizada por medio de la aplicación web descrita 
en el capítulo anterior https://databasecovid19.ups.edu.ec/. Con 
dichas señales de tos obtenidas y adecuadamente filtradas, se lle- 
vó a cabo el modelado y la clasificación utilizando un proceso 
de aprendizaje automático denominado Transfer Learning para 
reconocer una tos COVID. 
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Figura 24 
Diagrama conceptual utilizado para la caracterización de una tos COVID 
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Uno de los aspectos claves para el buen funcionamiento y ren- 
dimiento de los sistemas de Machine Learning es la base de datos que 
se utiliza para su entrenamiento y en ella, es importante la variabilidad 
de la información, así como el equilibrio en el número de muestras 
de cada categoría, ya que así va a contener los elementos esenciales 
que definir los patrones que se pretenden reconocer. Por ello, se debe 
buscar por todos los medios posibles equiparar el número de mues- 
tras por cada clase. Una base de datos insuficiente puede llevar a que 
el sistema no tenga la capacidad de albergar dentro de su “modelo” 
algunos de esos elementos esenciales y que no sea capaz de realizar el 
reconocimiento adecuadamente, quedando “subentrenada”. Por otra 
parte, una base de datos con un exceso de información redundante 
puede llevar a que el sistema “aprenda” demasiado los patrones de 
entrada mostrados y que falle en el reconocimiento si es que la señal 
de entrada resulta apenas diferente al parámetro entrenado, lo que 
indica que la red ha quedado “sobre entrenada”. 


En ese contexto, siendo conscientes que lo que se requería era 
una base de datos de señales audibles de tos de dimensiones significa- 
tivas que asegure un buen rendimiento del sistema de reconocimiento, 
se ejecutaron estrategias a nivel local y nacional para conseguirlo. 
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Por una parte, se solicitó la donación de “tos” y de información de 
la ciudadanía por medio de redes sociales, entrevistas en radio y te- 
levisión y, por otra parte, era prioritario conseguir audios de tos de 
fuentes de información externas. Como se ha descrito anteriormente, 
se había detectado que, tanto en la Universidad de Cambridge y en 
el Massachusetts Institute of Technology se estaba trabajando en la 
misma idea de convocar a la ciudadanía a aportar con su tos para la 
generación de las bases de datos que servirían posteriormente para el 
entrenamiento de sistemas de reconocimiento de la COVID-19 por 
medio de la tos, así que era clave contactar con alguno de ellos para 
conseguir dicha información. Así, la intención fue la de obtener la 
mayor cantidad de información a nivel local y nacional para luego 
complementar dicha información con las bases de datos, ya sea de 
Cambridge o del MIT. 


La base de datos nacional 


La base de datos local y nacional se generó a través de la página 
web https://databasecovid19.ups.edu.ec/ mediante la participación 
voluntaria y anónima de la ciudadanía en general, con un mayor 
índice de participación de personas de la ciudad de Cuenca y con 
participación moderada de ciudades como Quito y Guayaquil. Se 
entendía que el mayor número de personas participantes hayan sido 
de la ciudad de Cuenca, debido a que fue la ciudad donde se pudo 
realizar una campaña de difusión de la iniciativa de una manera 
más amplia. 


Esta base de datos se elaboró con el objetivo de que almacenase, 
por una parte, la señal audible de tos en formato .wav y, por otra parte, 
los metadatos que permitieran clasificar a las señales audibles dentro 
de diferentes subcategorías, tal como se indica en la tabla 1: 
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Tabla 1 
Estructura de la base de datos 
Variable Descripción Tipo Rango Categorías 


Número de identifi- 
Id cación asignado Nominal N/A [N/A 
al participante 


Respuesta a la 0. Negativo 
Diagnóstico pregunta ¿Posee Categórica | 0-1 
COVID-19? “0 
1. Positivo 


0. Sintomático 
Verificación del y diagnosticado por test 
diagnóstico y sinto- 


Verificación z j Categórica | 0-2 1. Sintomático 
matología asociada sin diagnóstico 
al COVID-19 

2. Asintomático 
0. 1-3 días 
Número de días E 
: 1. 4-8 días 
] desd E ; 

Temporalidad es ñ e SR Categórica | 0-3 
ron los síntomas O 2. 9-15 días 
se realizó la prueba. 

3. Mayor a 15 días 
Condición de fuma- 7 0. No 

Fumador e Categórica | 0-1 
dor del participante L Sí 

ad Condición de asmá- 7 0. No 

Asmático A ma Categórica | 0-1 
tico del participante 1 Sí 
Edad ños del ] 

Edad AE AO Continuo | 0-71 | N/A 
participante 

0. Mujer 
Sexo del : y 

Sexo e e Categórica | 0-1 

participante 1. Hombre 


Grabación eranación aliado Continua N/A N/A 
por el participante 


La información para la base de datos se recolectó desde julio 
de 2020 hasta febrero de 2021, y a partir de ella, se realizó un análisis 
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de factibilidad de su uso en base de diversos parámetros, entre los 
que estuvieron: 


Los datos útiles. En total se consiguieron 935 registros, es 
decir, casi mil personas accedieron al sitio web con la inten- 
ción de participar del llamado para donar su tos. De ellas, 
solo 368 personas lograron cumplir adecuadamente todos 
los pasos requeridos, el envío adecuado de un archivo de 
audio y el llenado de la encuesta en línea. El alto número de 
participaciones incompletas o inconclusas llevó a reevaluar 
el procedimiento utilizado para la toma de muestras y el 
diseño mismo de la página web. 

Audios certificados positivos o negativos. Si bien, dentro 
de las restricciones de la aplicación web se contaba con una 
pregunta para los participantes, en la que se les pedía que 
indiquen si el diagnóstico manifestado estaba respaldado 
por una prueba RT-PCR, no existía manera de garantizar la 
veracidad de dicha información y provocaba que el sistema 
no pudiera garantizar que en realidad estuviese caracteri- 
zando las señales audibles de casos positivos. Para solventar 
este particular, se estableció con uno de los laboratorios que 
llevaban a cabo las pruebas de diagnóstico por RT-PCR a la 
ciudadanía en la ciudad de Quito y se logró establecer un 
procedimiento fiable para el almacenamiento de la informa- 
ción que permitiese contar con la señal audible de tos y la 
prueba certificada. Sin embargo, el organismo financiador 
del proyecto (CEDIA) no vió con buenos ojos la propuesta y 
no autorizó dicho procedimiento, con lo que no fue posible 
avanzar más en esa línea. 


Dadas las dificultades encontradas para obtener una certifica- 
ción de los casos positivos de las señales audibles de tos y por ende, la 
imposibilidad de contar con una base de datos cien por ciento con- 
fiable, se establecieron contactos con el Departamento de Ingeniería 
de la Universidad de Cambridge y particularmente con el grupo de 
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investigación de Mascolo y compañía, para saber qué posibilidades 
existían de compartir información relacionada con el proyecto, y 
particularmente la base de datos que ellos habían recopilado (Brown 
et al., 2020). Luego del contacto correspondiente y de las autoriza- 
ciones respectivas, se pudo obtener la base de datos mencionada y se 
empezó a utilizar dicha base para el entrenamiento y la evaluación 
de los sistemas de prueba. 


La base de datos de Cambridge 


La base de datos de Cambridge ha sido aprobada por el Comité 
de Ética del Departamento de Ciencia Computacional y Tecnología 
de la Universidad de Cambridge. Las señales audibles de tos y los 
metadatos se han obtenido con un método similar al seguido para la 
obtención de la base de datos local y nacional, con lo cual era perfecta- 
mente adaptable y adicionable. A los usuarios también se les preguntó 
sobre su edad y género, así como su sintomatología, para finalmente 
requerir el archivo audible de una secuencia de tos, solicitando para 
ello, tres expectoraciones como mínimo. 


Con fecha de corte al 22 de mayo de 2020, la base de datos de 
la Universidad de Cambridge contaba con información de un total 
de 6613 registros válidos. De los cuales, 4352 usuarios ingresaron la 
información por medio de una aplicación web diseñada para el efecto, 
y 2261 usuarios lo hicieron por medio de una aplicación Android que 
llevaba el mismo objetivo de recolectar la información. De todo este 
universo de datos, se obtuvieron 235 registros de casos positivos para 
COVID-19, distribuidos, 64 en la web y 171 en la aplicación Android. 
De todas las grabaciones de casos positivos confirmados, se utilizaron 
únicamente aquellas que tenían como máximo 14 días desde la fecha 
de la prueba, obteniendo 141 grabaciones válidas. 


Para la definición del grupo de control, utilizaron tres conjun- 
tos de usuarios. El primero estuvo constituido por usuarios de países 
donde el virus no era prevalente en el tiempo de la toma de muestras, 
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con lo que fueron definidos como usuariosNoCovid, lo que eran 298 
muestras. El segundo conjunto de usuariosNoCovid estuvo formado 
por usuarios como los del primer conjunto, pero que, sin embargo, 
habían declarado presentar tos al momento de la toma de muestras; 
en este conjunto se obtuvieron 32 muestras. Por último, el tercero, 
pertenece a personas con asma, quienes no han sido diagnosticados 
como positivos para COVID-19, pero que sin embargo presentaban 
tos; en este grupo se obtuvieron 20 muestras. 


En la tabla 2, se resumen las características de la base de datos 
compartida por la Universidad de Cambridge para el estudio de carac- 
terización propuesto. En los archivos entregados se pudo diferenciar si 
los pacientes eran sintomáticos o no, además del tipo de recolección, 
es decir, si se llevó a cabo mediante la aplicación web o la aplicación 
Android. El total de muestras con las que se contó para los análisis 
que se van a exponer más adelante, fueron 491. Correspondiendo a 
141 muestras de casos positivos y 350 muestras de casos negativos. 


Tabla 2 
Características de las grabaciones de tos de la base de datos de Cambridge 
do Tipo de tos Medio de recolección Ss 

Positivo No sintomática Aplicativo Android 64 
Positivo Sintomática Aplicativo Android 46 
Positivo No sintomática Página web 23 
Positivo Sintomática Página web 8 
Negativo No sintomática Aplicativo Android 137 
Negativo Sintomática Aplicativo Android 8 
Negativo No sintomática Página web 161 
Negativo Sintomática Página web 24 
Negativo Asmática Aplicativo Android 13 
Negativo Asmática Página web 7 
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La base de datos obtenida a nivel local y nacional debido a las 
desventajas que se describieron líneas arriba, no pudo ser utilizada 
para la evaluación del sistema de caracterización de la tos COVID, ya 
que no se habría tenido certeza de que las métricas entregadas por 
el sistema hubieran sido realmente producidas por características de 
una tos COVID, y que más bien, se podrían estar evaluando caracte- 
rísticas de una tos cualquiera. Por esta razón, esta base se utilizó como 
conjunto de evaluación del modelo generado con la base de datos de 
la Universidad de Cambridge, ya que esto permitía comprobar, en 
base del rendimiento conseguido por el sistema, comprobar en qué 
medida se llegaba, o no, a tener un rendimiento similar. Si se obtenía 
un rendimiento similar podríamos garantizar la idoneidad de la base 
de datos, en tanto que, si el rendimiento difería sustancialmente, sería 
un indicador de que la metodología utilizada para obtener la base 
de datos local y nacional podría no haber sido la mejor y que sería 
prioritario, para próximas tomas de datos, que se solicite información 
certificada de los casos positivos por medio del contraste con pruebas 
PT-PCR, garantizando así la idoneidad de la información. 


Propuesta de caracterización 
de la tos como una tos COVID 


La hipótesis que se manejó fue que la “tos” podría ser tratada 
como “voz”, y que, al presentarse en el espectro audible y por su dura- 
ción en el tiempo, sería factible el uso de un enfoque fonotáctico para 
su análisis. El enfoque fonotáctico en el ámbito del reconocimiento 
automático de idioma (Soufifar et al., 2011), utiliza las señales a nivel 
de fonemas, pero considerando también a los elementos adyacentes 
al fonema, con lo que se gana información de contexto de la señal, 
este particular suele ser de gran utilidad en tareas de reconocimiento 
de idioma. Para el caso de la tos, se buscó manejar el mismo enfoque 
fonotáctico, se pretendió obtener las características propias de una 
tos COVID como si fuera un fonema y considerar a los eventos apa- 
recidos inmediatamente antes y después de la tos como “información 
de contexto”, que se espera, favorezca las tareas de reconocimiento. 


En general, la extracción de características de una señal audible 
puede lograrse por medio de herramientas de procesamiento digital 
de señales o utilizando sistemas de aprendizaje automático. Estos dos 
métodos también son los que podrían utilizarse para el caso de las 
características de una señal de tos, recordando que la misma ha sido 
tratada como una señal audible de habla. La ventaja del primer método 
radica en que se tiene un control total de los parámetros establecidos y 
de la manera que se conforma el modelo de reconocimiento, mientras 
que con el segundo método se pierde el control del modelo y más 
bien hay que ajustarlo adecuadamente para darle a la máquina, los 
elementos necesarios que le permitan “aprender” las formas de una 
tos COVID y distinguirlas de aquellos sonidos que pueden ser no-tos 
o una tos no-COVID. 
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De pruebas iniciales, se pudo notar que la vía del procesamiento 
digital de señales para la caracterización no iba a ser suficiente para 
conseguir una diferenciación entre diferentes toses, principalmente 
por las similitudes entre dichos patrones en el dominio de la frecuen- 
cia y por la alta variabilidad de las señales en el dominio del tiempo, 
factores que seguramente iban a dificultar la tarea de reconocimiento. 
Estos factores fueron determinantes en la decisión del uso de sistemas 
de aprendizaje automático para la caracterización, manteniendo la 
hipótesis de tratar a la “tos” como si se tratara de una “voz”. 


En este contexto, se utilizó la estructura típica de los sistemas 
de reconocimiento de voz que están integrados por dos etapas. Una 
primera etapa denominada “Front-End” que es donde se realiza el 
preprocesamiento requerido de la señal y en la que se busca adecuar 
las señales de entrada de tal manera que represente fielmente el fenó- 
meno que se pretende modelar, y que, para el caso de la caracterización 
de la tos, se corresponde con la separación de las señales audibles de 
entrada, ya sea, de tos y de no-tos, además del filtrado de la señal. Y la 
segunda etapa denominada “Back-End” donde se genera un modelo 
general a partir de las señales audibles de entrada, esto con el fin de 
determinar y agrupar las características que definen a los fenómenos 
analizados. Para el caso de la caracterización de una tos-COVID, se 
generaron tres modelos diferentes, obtenidos individualmente a partir 
de la aplicación de tres tipos de técnicas para intentar caracterizar las 
señales de tos previamente filtradas, todo con el fin de definir si se 
corresponden con señales de tos COVID o no-COVID. La estructura 
del sistema de caracterización se muestra en la figura 25. 


Figura 25 
Sistema general de caracterización de una tos COVID 
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La etapa Front-End 


Las señales de audio que se procesaron fueron señales analógicas 
variantes en el tiempo, que suponían una tarea compleja si se pretendía 
obtener su caracterización directa. Por esta razón se decidió trabajar 
con el espectro de frecuencia y con los parámetros cepstrales de Mel 
(Davis y Mermelstein, 1980) para su representación. Aún, contando ya 
con los parámetros de Mel y a pesar de conocer sus buenas prestacio- 
nes en los sistemas de reconocimiento de voz, se consideró que sería 
importante aprovechar la información espacial que con seguridad iba 
a aparecer en la producción misma de la tos, y por esa razón se decidió 
trabajar con diagramas bidimensionales tiempo-frecuencia, también 
llamados “espectrogramas”. Por otra parte, en base del análisis de las 
bases de datos, se pudo notar que estaban desbalanceadas, esto era 
un evento predecible, dado que, en el contexto de la evolución de la 
pandemia, el número de casos positivos siempre ha sido menor que 
el número de casos negativos y por ende, se iban a tener más personas 
donantes de tos negativas que positivas a COVID-19. Para corregir 
el desbalance, se aplicaron y evaluaron técnicas de aumento artificial 
de datos. Así, la primera parte de la etapa Front-End, la que permitía 
depurar la señal de entrada, consistió en la conversión de archivos de 
audio .wav a imágenes bidimensionales representadas por espectro- 
gramas, pasando por una fase de aumento de datos y otra de filtrado 
y eliminación de silencios. 


La segunda parte de la etapa Front-End, utilizó las imágenes de 
los espectrogramas preprocesadas en la primera parte como entradas 
de un sistema de reconocimiento de tos no tos. Para ello se entrena- 
ron tres modelos de aprendizaje automático, uno formado por redes 
neuronales convolucionales, otro por Random Forest y un último 
formado por modelos ocultos de Markov, para finalmente elegir el 
modelo que ofrecía la mejor métrica, o lo que es lo mismo, la mayor 
precisión de reconocimiento. Lo que se esperó a la salida de la fase de 
Front-End es obtener la mejor clasificación de los archivos de audio 
y separar a aquellos que contienen tos de los que no. En la figura 26 
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se puede ver la estructura general de la etapa Front-End. Y posterior- 
mente se detallan todas las técnicas utilizadas en el Front-End para 
el tratamiento de las señales. 


Figura 26 
Estructura de la fase Front-End 
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Aumento artificial de datos 


Como se ha indicado anteriormente, tanto la base de datos obte- 
nida a nivel local y nacional, como la compartida por la Universidad de 
Cambridge, presentaron un desbalance importante entre las muestras 
de casos positivos y negativos, lo que podría disminuir el rendimiento 
de los sistemas de aprendizaje implementados. Por ello y con el fin de 
equilibrar las bases se aplicó la técnica de aumento artificial de datos. 
Para el caso analizado, este aumento artificial de datos se consiguió 
mediante la manipulación de los archivos de audio de entrada, apli- 
cando en ellos, procedimientos de adición de diversos tipos de ruido 
y variación en la tasa de muestreo. Un aspecto importante de esta 
técnica es que debe llevarse a cabo de una manera mesurada, de tal 
manera que no modifique significativamente los audios originales, lo 
que llevaría al sistema a identificar y clasificar parámetros artificiales 
que perjudicarían la tarea principal de reconocimiento. Otro aspecto 
fundamental de esta técnica es que debe realizarse únicamente en el 
conjunto de audios que se utilicen para el entrenamiento del modelo, 
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en la fase de evaluación no deben incluirse audios que hayan sido 
manipuladas artificialmente. Y, por último, el porcentaje de datos 
aumentados no debe superar del 10 % al 20 % del número total de 
datos, para evitar el sobre entrenamiento del sistema. 


Considerando estos aspectos, se realizaron los siguientes proce- 
dimientos: variación de la tasa de muestreo, adición de ruido y despla- 
zamiento de la frecuencia. Tanto, el desplazamiento de la frecuencia, 
como la adición de ruido se realizó con un máximo del 20 % de la 
señal original, esto con el fin de mantener la información relacionada 
con el objetivo de reconocimiento (Cui et al., 2015). El desplazamiento 
de la frecuencia consistió en la variación aleatoria del pitch de la señal 
de audio, mientras que la adición de ruido se aplicó incrementando 
aleatoriamente los valores de amplitud en los audios originales. Con la 
implementación de estas técnicas, se consiguió aumentar el tamaño de 
la base de datos en un factor de cinco veces el tamaño de la base original. 


Para comprobar si el aumento artificial de datos tuvo un im- 
pacto positivo en la base de datos general y en el balance de la base 
de datos, se llevaron a cabo pruebas para evaluar la estabilidad del 
sistema midiendo varias métricas, y entre ellas a la entropía cruzada, 
pudiendo comprobar, tal como se puede ver en la figura 27, que el 
aumento de datos le permitió a la máquina aprender de mejor manera 
la información de las imágenes de entrenamiento, generando una 
mejora en los audios evaluados. 


Figura 27 
Métricas utilizadas para medir la eficacia de aplicar el aumento artificial de datos 
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Separación de señales audibles y silencios 


Dado que, en la producción de las secuencias de tos, es casi un 
hecho la aparición de regiones de “silencio”, y que estas regiones no 
aportan con información significativa en la tarea de caracterización, 
se decidió llevar a cabo un procedimiento que permitía eliminarlas. 


Lo primero que se debía lograr era la separación de la señal au- 
dible (sea o no tos) de los silencios, y para ello fue necesario visualizar 
el audio de la secuencia de tos en el dominio del tiempo que incluyera 
múltiples eventos de inspiración y expectoración. Tres secuencias de 
tos se muestran en la figura 28 y dejan ver la alta variabilidad de la 
señal a lo largo del tiempo, así como los diferentes patrones que se 
pueden presentar en los eventos de tos. 


Figura 28 


Secuencias de tos en el dominio del tiempo 


1 


Considerando el enfoque fonotáctico, estas secuencias de to- 
ses se han dividido en tramas de 20 ms muestreadas a 16 kHz, para 
posteriormente obtener la transformada de Fourier de cada una de 
ellas considerando un tamaño de espectro de 512. A la señal obtenida 
se le pasó por un filtrado cepstral basado en las frecuencias de Mel 
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(Davis y Mermelstein, 1980), con lo que se obtuvo un conjunto de 
coeficientes de frecuencias cepstrales (que suelen ser 13) entre 0 y 
8kHz, para cada una de las tramas de tiempo. Con los valores de los 
coeficientes de frecuencia para cada trama de 20 ms se puede construir 
un mapa bidimensional de la señal de tos, que es el espectrograma 
que se muestra en la figura 29. 


Figura 29 
Espectrograma generado a partir de las secuencias de tos 


Espectrograma Original 


Para realizar la separación entre la señal audible y los silen- 
cios, se realizó una comparación del valor de la desviación estándar 
de cada trama con el correspondiente de la media de la desviación 
estándar de la grabación de las secuencias de tos. De esta manera 
se definió un límite mínimo para la desviación estándar de cada 
trama, y con ello se pudo decidir si en una trama existió o no un 
evento de silencio. Luego de aplicar este método, se consiguió se- 
parar eficazmente la señal audible de los silencios. El resultado se 
puede ver en la figura 30. 


CHRISTIAN SALAMEA PALACIOS 


112 


Figura 30 
Espectrograma sin eventos de silencio 
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Luego de haber realizado la eliminación de los silencios en el 
espectrograma, la señal transformada al dominio del tiempo, ya sin 
presencia de eventos de silencio, es la que se presenta en la figura 31. 


Figura 31 
Señal audible ya eliminados los eventos de silencio 
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Todo esto, dio cuenta de que la información contenida en los 
espectrogramas tenía una correspondencia directa con las señales 
audibles en el dominio del tiempo, y por ello, se pudieron usar eficaz- 
mente como elementos de entrada para los sistemas de aprendizaje 
automático donde se esperaba aprovechar de la información espacial 
implícitamente contenida en ellos. 


La siguiente fase en el preprocesamiento, es decir, luego de la 
obtención de los espectrogramas y la eliminación de los silencios con- 
tenidos fue la de utilizar dichos espectrogramas como elementos de 
entrada para un sistema de reconocimiento de tos y no tos. La idea de 
esta fase se sustentó en el hecho de que se deseaba contar únicamente 
con señales de tos para la caracterización y para conseguirlo, se debía 
primero, distinguir que audios eran los que contenían tos. Para ello, 
se realizó una clasificación de los audios que contenían tos, definiendo 
con ellos una primera categoría o estado de la naturaleza y, por otra 
parte, se clasificaron aquellos que no contenían tos como una segunda 
categoría. Este procedimiento permitía agrupar aquellos audios de 
secuencias de tos que luego fueron analizados posteriormente en la 
fase Back-End para saber si son COVID o no-COVID. 


Para llevar a cabo la mencionada clasificación se debieron eva- 
luar diferentes técnicas, las que, según sus potencialidades, podían 
resultar más o menos eficaces en la tarea requerida. Con este enfoque 
y tal como se describió anteriormente, se evaluaron tres herramientas 
de aprendizaje automático: las redes neuronales convolucionales, la 
técnica de Random Forest y los modelos ocultos de Markov. 


En relación con las redes neuronales convolucionales (CNNs) 


Las redes neuronales convolucionales constituyen, hoy en día, 
una herramienta eficaz de aprendizaje automático que utiliza el algo- 
ritmo de retropropagación (Rojas, 1996) para conseguir el aprendizaje 
de las características fundamentales de parámetros bidimensionales 
(imágenes) de entrada. Se caracterizan por el uso de “filtros convolu- 
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cionales” que permiten extraer la información más significativa de una 
imagen, así como difuminar la información menos relevante existente. 
Con ello, se retiene información espacial, fundamental en la tarea 
de reconocimiento y diferencial de otros tipos de redes neuronales, 
como el “perceptrón multicapa” (MLP) (Murtagh, 1991), donde los 
parámetros de entrada deben ser uni-dimensionales. 


Así, las CNNSs (Albawi et al., 2017), inicialmente posibilitan la 
adecuación de la imagen por medio de los siguientes procedimien- 
tos: filtros convolucionales, pooling en sus diversas formas (máximo 
o promedio), bootstraping, strade (permite definir el tamaño de la 
imagen de salida), dropout (para aportarle generalización a la red) 
y el padding (que permite normalizar la imagen) para hacerla, en la 
mayoría de las veces, ortogonal. 


La extracción de características por medio de CNNs se consigue 
gracias a la utilización continua de módulos de filtros convolucionales 
seguidos de módulos de pooling. Cuantos más pares de estos módulos 
estén presentes en la estructura de la red neuronal, se podrá extraer 
información más “profunda” de las imágenes. Es por ello, que a las 
CN Ns se les considera parte de lo que se denomina hoy “Deep Lear- 
ning” (LeCun et al., 2015). Sin embargo, se debe ser cauto en el número 
de pares de módulos utilizados, dado que su inclusión involucra un 
mayor costo computacional y la obtención de modelos más complejos 
que al final perjudican la tarea de reconocimiento. 


A pesar de estar enfocadas en aprovechar la información espacial 
contenida en imágenes, las CNNSs requieren, irremediablemente de 
un proceso de flattening y de una red neuronal perceptrón multicapa 
(MLP) en su fase final, esto porque se requiere una clasificación que 
determine la probabilidad de que una imagen pertenezca a una u otra 
categoría o estado de la naturaleza. Con lo que se asumió, que inicial- 
mente se tenía que llevar a cabo todo el procedimiento convolucional 
y así, obtener la mayor cantidad de características espaciales, para 
luego, transformar estas características a vectores unidimensionales, 
útiles para ser las entradas de una MLP en un proceso de clasificación. 
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A manera de ejemplo, en la figura 32 se muestra la estructura de una 
CNN, con: 


+ Una entrada bidimensional de 32x32 pixeles 

+ Dos pares de capas convolucional-pooling, cuyo primer par 
está formado por un filtro convolucional de 6 capas de 28x28 
y un pooling de 6 capas y de 14x14. El segundo par está 
formado por un filtro convolucional de 16 capas de 10x10 
y un pooling, también de 16 capas, pero de 5x5. 


Además, una MLP para la clasificación conformada por 120 
neuronas en la capa de entrada, 84 en una capa intermedia y 10 neu- 
ronas en la capa de salida. 


Figura 32 
Estructura de una red neuronal convolucional 
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Con estos antecedentes y ya para el caso práctico del recono- 
cimiento tos no-tos, se utilizaron las imágenes de los espectrogramas 
de Mel como entradas a la CNN. Entendiendo que estas imágenes se 
correspondían con las señales de audio cuya variable independiente es 
temporal, se utilizaron todos aquellos que tenían una duración entre 
0.3 seg y 4.55 seg, para recortarlos cada 2 segundos de duración. De 
esta manera se obtuvieron imágenes de audio de (16x200), 16 por los 
coeficientes Mel que se utilizaron y 200 por las tramas utilizadas para 
completar los 2 segundos. Así, la red neuronal se configuró con dos 
capas convolucionales de 16 unidades lineales rectificadas cada una. 
La primera capa toma los MFCCs de (16x200) como entradas y pasa 
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por un filtro de (9x3), seguido por una capa de 2x1 de max-pooling. 
La segunda capa convolucional tiene un filtro de 3x3 seguido por otra 
capa de 2x1 de max-pooling. Las capas MLP en el proceso de clasifica- 
ción están formadas por 256 unidades cada una. Se ha implementado 
una normalización por batch y una regularización de tasa de 0.5 de 
dropout para reducir los problemas de sobre-entrenamiento de la red. 
La estructura descrita para separar las señales de audio de tos y no tos 
se muestra en la figura 33. 


Figura 33 
Estructura de una CNN utilizada para el reconocimiento tos no-tos 
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Front-End Back-End 


En relación con los árboles de búsqueda 
y el “Random Forest” 


La generación de reglas de clasificación (reglas de decisión) 
tiene la ventaja de ser más significativa y sencilla de interpretar que 
otras técnicas de clasificación. También se corresponde con un enfo- 
que estándar de la ciencia de Sistemas Expertos y en muchos casos, 
pueden ser agrupadas en forma de estructura de árbol, formando un 
árbol de decisión (Patel y Rana, 2014). 


Los árboles de decisión son estructuras de flujo de datos que 
habitualmente son usadas para determinar una acción secuencial. 
Consta de ramas y nodos, cada rama representa, por una parte, un 
posible valor de un atributo y por otra, una regla de decisión, mientras 
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que los nodos corresponden a un atributo de entrada. Debido a que 
los atributos de entrada pueden ser de varios tipos según su función 
dentro del árbol, se definen los siguientes tipos de nodos: 


+ El nodo raíz que es aquel donde nace el árbol y donde se 
juntan todas las características a estudiar. Normalmente, el 
nodo raíz es aquel que tiene más conexiones con otros nodos. 

+ El nodo hoja que lleva la clasificación de la decisión. 

+ El nodo de decisión que es un nodo intermedio que tiene 
dos o más ramas, y por ende lleva a un nuevo análisis que 
hará crecer el árbol. Normalmente aparecen debajo del nodo 
raíz cuando no se tienen clasificaciones puras. 


Los árboles de decisión se utilizan en procesos de clasificación 
debido a que permiten observar la lógica de los datos, a diferencia de 
lo que ocurre con las redes neuronales o las máquinas lineales, como 
NNs o SVMs (Suthaharan, 2016), respectivamente. Están particu- 
larmente orientados solo a ciertos problemas de clasificación donde 
se pueden establecer comparaciones binarias que permitan separar 
elementos, llegando a ser uno de los métodos de aprendizaje inductivo 
más utilizado. 


Formalmente, a los árboles de decisión se les denomina CART 
(Classification and Regresion Trees) que se definen como “estricta- 
mente binaries” y se crean a partir de particiones recursivas, con el 
fin de dividir los datos mediante reglas para que se distribuyan a la 
izquierda y derecha del árbol de la mejor manera posible. 


En un CART se asume que el conjunto de datos de entrena- 
miento está etiquetado y así se divide progresivamente el conjunto de 
ejemplos de entrenamiento en subconjuntos más pequeños. Cuando 
todas las muestras de un subconjunto tienen la misma etiqueta se dice 
que el subconjunto es “puro”. En el caso de que no, se pasa a decidir si 
el proceso de división continúa, la función objetivo que se persigue en 
este caso con los nodos de decisión es la maximización de la ganancia 
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de información en cada subdivisión de un árbol de decisión, que es 
equivalente a la minimización del criterio de impureza. 


La ganancia de información (Gl) es la medida del decremento 
de la entropía luego de haber dividido el conjunto total de datos. 
Conforme el árbol crece hacia abajo, la entropía decrece y en la rama 
final del árbol la entropía es igual a cero. Así, la GI mide la forma en 
que un atributo clasifica los datos de entrada. Para determinar el valor 
de GI se resta la información del conjunto de datos (E) menos la que 
aporta el atributo analizado (X). Así, 


Ganancia(E,X)=info(E) — info(E,X) 


Las impurezas de los nodos. El concepto de pureza de un nodo 
está definido por la impureza del mismo. En todos los casos se busca 
que la impureza sea cero y esto se consigue si todos los patrones que 
alcanzan el nodo tienen la misma etiqueta o categoría. La métrica más 
popular es la “impureza de entropía”, que se define como: 


¡(N) = — E¡P(w)og2P(w;) 


donde P(w;) es la fracción de patrones en el nodo N que están 
en la categoría Y. 


Si bien, los árboles de decisión posibilitan una clasificación casi 
heurística y simple de visualizar, define una única ruta para la solu- 
ción, obviando otras posibles opciones de crecimiento del árbol y por 
ende de la consideración de otras variables que pudieran mejorar la 
tarea de clasificación, (Liaw y Wiener, 2002) propusieron una técnica 
relacionada al ensemble learning en la cual se pueden generar varios 
clasificadores y agregar el conocimiento de cada uno de ellos en una 
clasificación final donde se define la categoría a partir de un proceso 
de votación, ejemplos de esto se pueden ver en técnicas como el boos- 
ting (Schapire et al., 1998) y el bagging (Breiman, 1996) aplicadas a 
árboles de decisión. Fue Breiman quien propuso la técnica llamada 
Random Forest (Breiman, 2001) la cual consistía de una capa adicional 
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de introducción de aleatoriedad en el proceso de bagging. Adicional- 
mente, la construcción de cada árbol usa una diferente muestra de 
datos de entrada modificando la forma en como cada árbol se crea. 
En los árboles estándar, cada nodo es el resultado de una subdivi- 
sión que mejor divide entre todas las variables. En el Random Forest, 
cada nodo se subdivide usando el mejor subconjunto de predictores 
aleatoriamente elegidos en ese nodo, lo que le lleva a un rendimiento 
superior a otros clasificadores como NNs o SVM, además de ser muy 
robusto ante el sobreentrenamiento. 


El Random Forest constituye un sistema de aprendizaje supervi- 
sado utilizado para clasificación. Está formado, por una parte, por la 
palabra “Forest”, en razón de que en el se combinan varios clasificadores 
constituidos por árboles de decisión con diferentes configuraciones 
y por otra parte, por la palabra “Random” que viene dada por las 
siguientes consideraciones: 


+ Las muestras de entrenamiento se toman de forma aleatoria 
para construir los árboles. 

+ El subconjunto aleatorio de los atributos de entrada se ob- 
tiene cuando se hace la división en los nodos. 


Las predicciones hechas por los árboles de decisión individuales 
pueden ser poco precisas, pero combinadas, en promedio, la predicción 
es más cercana al objetivo. 


Cada árbol de decisión considera un subconjunto aleatorio de 
atributos y, solo tiene acceso a un conjunto aleatorio de los datos de 
entrenamiento. Esto incrementa la diversidad en el “forest” favore- 
ciendo la generalización de sistema y por consiguiente, obteniendo 
predicciones más robustas. Los vectores aleatorios usados tienen la 
misma distribución para todos los árboles del “forest”. Para realizar 
la predicción o la clasificación, Random Foresttoma un promedio de 
las estimaciones de los árboles individuales. 
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El error de generalización de un “forest” de clasificadores de- 
pende de la influencia de cada árbol y de la correlación entre ellos. 
La división de cada nodo se lleva a cabo por medio de una selección 
aleatoria de atributos. 


Con estos elementos de base, la segunda técnica utilizada para 
evaluar la separación de las señales audibles de tos no-tos ha sido la 
de Random Forest. Para ello, se han usado los mismos parámetros 
de Mel (MFCCs) de los espectrogramas, pero colocados en un array 
unidimensional, definiendo un total de 100 árboles en el conjunto y 
habiendo adicionado impurezas de tipo “Gini” (Yuang et al., 2021) 
para aportar generalización en la clasificación. 


En relación con los modelos ocultos de Markov 


Los modelos ocultos de Markov (HMMs) son modelos estocás- 
ticos cuyos estados se encuentran ocultos o no son visibles a simple 
vista. Lo que si ocurre es que cada uno de dichos estados puede emitir 
una salida que si es observable. 


Pueden ser, deterministas, si explotan características conocidas 
de la señal y estadísticos, si tratan de caracterizar las propiedades 
estadísticas de una señal. Existen otros modelos estadísticos como el 
Gaussiano, el de Poisson o el visible de Markov, en todos se asume 
que la señal se puede caracterizar adecuadamente por medio de un 
proceso aleatorio parametrizable. 


Los HMMs forman parte de un proceso doblemente estocás- 
tico: uno oculto, no visible y otro visible, que es el que produce la 
secuencia de observaciones. Se define como proceso estocástico al 
concepto matemático que sirve para caracterizar una sucesión de 
variables aleatorias que evolucionan en función de otra variable, que 
generalmente es el tiempo. 


Los HMMs son modelos paramétricos que permiten describir 
hechos acústicos del habla de forma eficiente. Se asume que la tran- 
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sición solo depende del estado previo y que la observación es solo del 
estado actual (1er orden). 


Un modelo oculto de Markov viene definido por los siguien- 
tes parámetros: 


2 =(4,B, IT) 


Donde: la matriz A representa la probabilidad de transición 
entre eventos (estados) y se le llama matriz de transición, la matriz B 
representa la probabilidad de observación y se le llama matriz de ob- 
servación y la matriz [7 que representa a las probabilidades de estado 
inicial y se le llama matriz de estado inicial. 


Habitualmente, tanto, las probabilidades de las transiciones 
entre estados (matriz A), como las probabilidades de la salida según 
el estado actual (matriz B) no son conocidas, por lo que deben ser 
estimadas con un algoritmo iterativo, como el algoritmo de Baum- 
Welch (McCallum, 2014) que utiliza como entrada a las observaciones. 
Finalmente, con la información obtenida de las matrices A y B, se 
definen las probabilidades de estar en un determinado estado inicial 
(matriz [7). Una vez definido el HMM se debe encontrar la secuen- 
cia Óptima de estados que lo produce. Para conseguirlo, se utiliza el 
algoritmo de Viterbi (Forney, 1973) el que permite hallar la secuencia 
más probable de estados ocultos. 


Ya en lo que corresponde a la detección de tos no-tos en una 
señal audible de entrada, se quiso evaluar en qué medida los HMMs 
podrían almacenar en sus estados ocultos, información relacionada 
con la de la tos en una señal de audio. 


Con esa visión, se entrenó un clasificador basado en los modelos 
ocultos de Markov que utilizan modelos de mezclas de gaussianas 
(Reynolds, 1988), definiendo el número de estados ocultos y maxi- 
mizando la verosimilitud en base del algoritmo de E-M (estimación, 
maximización) (Moon, 1996). 
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Resultados obtenidos en la fase Front-End 


Para describir la eficiencia y la potencialidad de uso de una u 
otra técnica se ha utilizado un conjunto de métricas tipo, que está 
conformado por la precisión, la exactitud, el recall y el F1-score, es- 
tas permiten comparar los aciertos y los fallos frente al número total 
de experimentos, en el momento de la clasificación. En la tabla 3 se 
muestran los valores obtenidos con el modelo de redes neuronales 
convolucionales (CNN), con el de Random Forest (RE), con los mo- 
delos ocultos de Markov (HMM) y con el sistema de votación de 
ensemble learning. 


Tabla 3 
Resultados obtenidos en la fase Front-End 
Measure CNN RF HMM vC 
Accuracy 0.942 0.946 0.813 0.950 
Precision 0.964 1.000 0.574 1.000 
Recall 0.794 0.779 0.911 0.794 
Fl-score 0.871 0.876 0.705 0.885 


En base de los resultados mostrados en la tabla 3 se pudo con- 
cluir que el modelo de árboles de búsqueda y random forest (RF) es 
la mejor opción para la tarea de reconocer en una señal de audio la 
existencia O ausencia de tos. Además, por los valores de precisión y 
de F1-score obtenidos se puede describir la tarea como una de tipo 
confiable, que garantiza que la señal de entrada que se va a utilizar 
para el modelado de una tos COVID o no-COVID en la fase Back 
End, van a ser señales audibles de tos y no de otros tipos de sonidos. 


La etapa Back-End 


En esta etapa se lleva a cabo el reconocimiento de las señales 
acústicas de tos obtenidas a la salida de la fase Front-End y de clasifi- 
carlas ya sea, como señales COVID o señales no-COVID. Para ello, se 
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han generado los modelos de reconocimiento correspondientes, en base 
de tres sistemas de aprendizaje automático diferentes basados en redes 
neuronales convolucionales, todo esto con el objetivo de generar varias 
opciones y elegir al final al de mejor rendimiento. El primer modelo fue 
generado en base de una red neuronal convolucional nativa, el segundo 
modelo y tercer modelo estuvieron también basados en redes neuronales, 
pero previamente entrenadas, YamNET y VGGish, respectivamente. 


En relación con el modelo de la red neuronal 
convolucional nativa 


El primer modelo evaluado tomó las imágenes de los espectro- 
gramas de tos generados en el Front-End que se obtuvieron con una 
FFT de 512 y un tamaño de imagen de 64x64, y se utilizaron como 
entradas de una CNN cuya estructura estuvo formada por tres capas 
convolucionales-máx pooling (16 filtros, (3x3)), (32 filtros, (3x3)), 
(64 filtros, (3x3)) y una MLP conformada por una capa oculta de 64 
neuronas, un dropout de 0,4 y una capa de salida de dos neuronas. En 
todos los casos, se utilizó la función RELU como elemento no lineal 
para el reconocimiento de patrones. 


Como resultado de esta red se obtuvo una precisión del 18 %, 
un recall del 100 % y un F1-score del 31 %, lo que muestra una in- 
consistencia profunda en la capacidad de clasificación, a pesar de que 
el accuracy ha presentado un valor superior al 80 %. Este desbalance, 
entre la precisión y el recall, muestra que el sistema se encuentra sobre 
entrenado, muy probablemente provocado por el escaso número de 
muestras audibles de tos disponibles para el entrenamiento y para la 
evaluación del modelo. El hecho de tener un recall del 100 % indica 
que el sistema puede reconocer con gran eficiencia los casos negativos 
de COVID, manifestándose sus limitaciones en la identificación de 
casos positivos a partir de las señales audibles de tos. 


Asumiendo que la dificultad de la tarea se presentó debido al 
escaso número de datos para el entrenamiento de la red, se empezó a 
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analizar la posibilidad de utilizar modelos previamente entrenados, 
como YamNet y VGGish, los cuales han sido previamente entrena- 
dos con miles y hasta millones de datos de entrada y cuyo modelo 
requiere de un conjunto relativamente pequeño de datos relacionado 
con la tarea a cumplir, para ser reentrenada y ajustada a dicha tarea. 
Este proceso de reentrenar un modelo general con datos propios de 
la tarea a resolver se conoce como “Transfer Learning”. Eso si, como 
condicionante, se requiere que las redes preentrenadas hayan utilizado 
vectores de parámetros relacionados con el proceso de clasificación 
al cual se le quiere adaptar, para el caso de este trabajo, ambas redes 
cuentan con señales audibles de tos entre los vectores de parámetros 
con los cuales fueron entrenadas en un primer momento para la ge- 
neración del modelo utilizado para el reentrenamiento. 


En relación con el modelo YamNet 


YamNet es un clasificador de eventos audibles que toma señales 
de formas de onda de audio como entradas y realiza predicciones 
independientes para cada uno de los 521 eventos de audio presentes 
en el conjunto de datos “AudioSet” (Google, 2020). YamNet utiliza la 
arquitectura “MobileNet V1” (OpenGenus IQ, 2020) que es una ar- 
quitectura de convolución separable en profundidad, que utiliza dos 
tipos de filtros convolucionales para la extracción de características, el 
“depthwise convolution” y el “pointwise convolution”. Considerando 
cada uno de estos pares como una capa, YamNet está formada por 28 
capas, una capa de “average pooling” de 7x7 y una MLP “fully connec- 
ted” formada por 1024x1000 neuronas, para un tamaño de imagen 
de entrada de 224x224x3. La clasificación se realiza con una función 
Softmax, lo que posibilita el enfoque de considerar a las salidas como 
una función de probabilidad. 


El modelo fue originalmente desarrollado y almacenado en el 
repositorio de modelos y soluciones de modelado para usuarios de 
TensorFlow “Tensor Flow Model Garden” (GitHub, 2022a), donde 
se pueden conseguir, el código fuente, el modelo resultante y más 
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documentación relacionada. YamNet admite como parámetros de 
entrada a matrices unidimensionales que contengan una forma de 
onda de longitud arbitraria y que estén representadas como muestras 
en solo canal “mono” y muestreados a 16kHz en el rango de [-1.0; 
1,0]. Internamente la forma de onda se divide en tramas de 0.96seg 
de duración y es la trama que se procesa. 


Figura 34 
Señales de entrada y salida de la red preentrenada YamNet 


Nota. https://blog.tensorflow.org/2021/03/transfer-learning-for-audio-data-with-ya 
mnet.html 


La salida de YamNet ofrece tres tipos de respuesta: un score que 
indica la predicción de la trama de entrada para una de las 512 cate- 
gorías de “AudioSet”, el embedding por trama que contiene el vector 
embedding de la salida de la capa de clasificación y el espectrograma 
logarítmico de Mel de la forma de onda total analizada. En la figu- 
ra 34 se pueden ver dos de esas respuestas, los scores indicando las 
categorías más probables mediante un mapa de colores entre blanco 
(menor probabilidad) y negro (mayor probabilidad) y el espectrograma 
logarítmico de Mel. 


La factibilidad del uso de YamNet para caracterizar una señal 
audible de tos, ya sea como tos COVID o como tos no-COVID, viene 
dada por el hecho de que, entre las 512 categorías pre entrenadas, se 
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encuentran señales de tos, lo que indicaba que la red, implícitamente, 
contenía información que posibilitaba el reconocimiento de señales de 
tos. Lo que se esperaba es que al reentrenarle con los datos relativos a 
tos COVID y tos no-COVID, YamNet adquiriese las características pro- 
pias de estas dos categorías y que por ende posibilite su diferenciación. 


En este sentido, al evaluar la fase Back-End con YamNet, se 
encontró que el reconocimiento se realizaba eficientemente si la tarea 
consistía en detectar las señales de audio de tos que representan un 
negativo a COVID-19. Sin embargo, Con los casos positivos fue otra 
historia, dado que con YamNet, la detección de los casos positivos a 
COVID-19 resultó una tarea muy complicada e ineficiente. Hablando 
de valores cuantitativos, de 183 señales audibles de tos negativas a 
COVID-109, el sistema fue capaz de detectar correctamente 81 audios 
mientras que falló en 102. Mientras que, de 48 señales audibles de tos 
positivas a COVID-19, acertó en 27 y falló en 21. 


En el análisis de los resultados, se determinó que la metodología 
utilizada por YamNet para formar las tramas con un tamaño estándar 
de 0,96 seg, limitaba las opciones de configuración y ajuste para con- 
seguir una mejor métrica de reconocimiento para los casos negativos. 
Por esa razón, se estudió la posibilidad de uso de una segunda red pre 
entrenada, la VGGish. 


En relación con el modelo VGGish 


La red pre-entrenada VGGish es una variante de un modelo mu- 
cho más amplio, denominado VGG (Simonyan y Zisserman, 2015), el 
cual está formado por una red neuronal convolucional muy profunda 
(Very Deep Convolutional Network) y que contiene varias configura- 
ciones, que van desde 11 hasta 19 capas de pesos. La variante VGGish 
se corresponde con una de dichas configuraciones, específicamente la 
de 11 capas de pesos pero con únicamente cuatro capas convoluciona- 
les-pooling, incorporando la característica propia del modelo VGG de 
conformar filtros de pequeño tamaño para el proceso de extracción de 
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características (3x64), (3x128), (3x256) y (3x512) y finalmente culminar 
con tres capas de MLP “fully connected” (4096), (4096) y (128) neuronas, 
que a la postre, define el tamaño de los embeddings que se generan a la 
salida del red. Una característica importante del modelo VGGish es que 
esta última capa no incluye una función de activación no lineal, con lo 
que el valor de los embeddings generados constituyen un valor de pre 
activación de la red (GitHub, 2022b). Son estos embeddings las salidas 
de la red VGGish y sirven de entrada de un clasificador binario que 
define si la tos se corresponde con una tos COVID o una tos no-COVID. 


Las entradas deben ser señales de audio remuestreadas a 16kHz 
en configuración de canal “mono”, separándolas en tramas de 25 ms 
con un sobrelapamiento de 10 ms y con el uso de ventaneado Hann 
formando los primeros espectrogramas. Los correspondientes de Mel 
se obtienen mapeando los espectrogramas de entrada a 64 bins de 
Mel, cubriendo el rango de 125 a 7500 Hz. Lo siguiente es obtener los 
espectrogramas logarítmicos de Mel y para ello se aplica justamente la 
función logarítmica (espectro de mel +0.01) donde el valor de 0.01 se 
utiliza para evitar la indeterminación provocada en el caso del espectro 
de Mel igual a cero. Todos los vectores de características generados son 
entonces muestreados en ejemplos no solapados de 0.96 segundos, donde 
cada ejemplo cubre 64 bandas de Mel y 96 tramas de 10 ms cada una. 


Ahora bien, el modelo VGGish se puede usar, ya sea como un 
extractor de características, o como parte de un modelo más grande. 
Para la tarea de reconocimiento de tos COVID, se ha optado por 
utilizarlo como extractor de características, donde VGGish convierte 
los audios de entrada en embeddings de tamaño de 128, los cuales 
contienen significado semántico y que son luego usados como entradas 
del modelo de clasificación. 


Luego de evaluar el modelo, se encontró que el uso del modelo 
VGGish como un “extractor de características” generó mejores resul- 
tados que el modelo de YamNet, por lo que, en la fase de producción 
del software para la caracterización de una tos COVID, se debería 
utilizar el modelo VGGish. 
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Los valores obtenidos en la evaluación del modelo VGGish 
fueron comparables con los resultados encontrados en los trabajos 
realizados por otras instituciones de investigación científica que han 
trabajado, también, con la idea de utilizar la señal audible de la tos para 
el diagnóstico de la COVID-19 (Brown et al., 2020), lo cual constituye 
un indicador de que la metodología propuesta fue la adecuada para 
la tarea a resolver. 


El sistema final 


Una vez que se procesan las señales audibles de entrada y se 
evalúan los modelos de reconocimiento, se obtienen los parámetros 
y los modelos necesarios para poner en fase de producción el sistema 
inteligente que permite realizar el análisis de señales audibles, tanto 
de aquellas que tienen tos, como de las que no. Dicho sistema está 
constituido por una sección de entrada, donde, por medio de un 
micrófono, se recibe la señal acústica provocada intencional o no in- 
tencionalmente por un usuario, para luego ser procesada, definiendo 
por medio de un sistema por votación, si dicha señal audible contiene 
o no tos. En caso de que contenga tos, dicha señal audible sirve de 
entrada para el modelado y para el proceso de clasificación, donde se 
decide si corresponde a una tos COVID o no COVID. Todo el proceso 
se muestra en la figura 35. 


Figura 35 
Sistema general de caracterización de tos COVID a partir de una señal audible 
de tos 


Front-End Back-End 
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El sistema final desarrollado, bien se podría utilizar como parte 
de un sistema inteligente de mayor alcance que podría servir para 
emitir un diagnóstico en relación con la enfermedad. En el caso de que 
se quisiera incursionar en esta tarea, además del sistema desarrollado 
en este trabajo, se deberían considerar, además de la señal audible de 
la tos, los otros síntomas más comunes de la enfermedad, aquellos 
que pueden aparecer y estar relacionados con las diferentes variantes 
y cepas que pueden aparecer en el tiempo. 


Considerando que la COVID-19 constituye, en esencia, un 
tipo de neumonía se asume que la tos será un síntoma recurrente de 
la misma, por lo que su caracterización constituiría un componente 
permanente de dicho potencial sistema de diagnóstico. 


Aún queda mucho camino por recorrer en esta línea de inves- 
tigación y obtener resultados satisfactorios y concluyentes. Una de las 
alternativas que se podrían estudiar es el análisis de la señal acústica 
de entrada para identificar en qué momentos se podría extraer la 
mayor cantidad de información particular de cada segmento, esce- 
nario que no se consideró en este trabajo, dado que se asumió que la 
mayor cantidad de información de la señal acústica se encuentra en 
el medio de cada trama. Otra de las alternativas de estudio tiene que 
ver con el tipo de modelado, se deben destinar esfuerzos para evaluar 
redes neuronales temporales desde la perspectiva del Deep Learning, 
tratando de que dicha información temporal puede ser integrada 
por la red y con ello mejorar la capacidad del modelado de señales 
con tanta variabilidad en el tiempo. Así, como estas propuestas, hay 
varios ámbitos donde se podrían aplicar y evaluar diferentes técnicas 
basadas en aprendizaje automático, y con ello, mejorar el rendimiento 
del sistema en su conjunto. 


Epílogo 


La aplicación de la tecnología de los sistemas inteligentes y el 
aprendizaje automático en ámbitos relacionados con la salud humana 
no es nueva, lo que es relativamente nuevo es la aceptación por parte de 
las ciencias médicas de tomar como válidos algunos de los resultados 
obtenidos a través de este tipo de tecnología para integrarlos en el diag- 
nóstico y en la delimitación de tratamientos para la cura de enfermedades. 


La determinación de la tecnología más conveniente y adapta- 
ble a una problemática que se quiera atender debe sustentarse en un 
amplio estudio previo que garantice la comprensión del fenómeno 
tratado y de las posibilidades reales de que la tecnología pueda resultar 
de utilidad. Así, si bien el ámbito de desarrollo, que se deriva de este 
trabajo exhibe una forma, un método, una manera de dar respuesta a la 
problemática de la pandemia de la COVID-19 a través de la tecnología 
y de la ingeniería, se presenta un antecedente bastante extenso que 
parte desde la percepción misma del autor frente a la realidad vivida 
en los tiempos más difíciles de la COVID-19 en el país, pasando por la 
descripción del virus y de las vacunas, para finalmente desembocar en 
la temática del diagnóstico, todo desde una narrativa respaldada por 
información periodística y científica. De todo el proceso, fue funda- 
mental comprender los hechos adecuadamente para determinar cuál 
era el ámbito donde la respuesta podía ser la más efectiva. 


Por ejemplo, la cura misma de la enfermedad no parecía un 
ámbito donde la respuesta de la ingeniería podría ser efectiva, mientras 
que en el diagnóstico o en tratamientos de contención de la enfermedad 
si se han encontrado respuestas más adecuadas. Así, el tratamiento de 
imágenes ha sido útil para valorar la presencia del virus por medio de la 
visualización de las cavidades pulmonares, incluso ha sido usado para 
determinar el grado de avance del virus en el cuerpo. Los respiradores 


CHRISTIAN SALAMEA PALACIOS 


132 


artificiales, por su parte, constituyeron una herramienta tecnológica 
fundamental para asistir a los pacientes graves, quienes requerían de 
un tiempo importante para recuperarse de la enfermedad. En esta 
obra, el estudio está orientado al diagnóstico de la enfermedad, pero 
desde el uso de señales de audio, si bien existen líneas de investigación 
que utilizan la voz como tal para tratar de diagnosticar la COVID-19, 
el enfoque propuesto en este trabajo estuvo enfocado en los posibles 
síntomas provocados por la enfermedad y por ello se orientó a la tos. 


Debido a las dificultades encontradas en el proceso, notamos 
que determinar un diagnóstico a través, únicamente, de la tos pare- 
cía aventurado y por ello, se decidió estudiar en primera instancia 
la caracterización, es decir, la determinación si una tos puede ser 
considerada como una tos COVID o no. Este enfoque nos permitió 
utilizar esta tecnología como insumo y no como un indicador ya que 
la tos caracterizada podrá constituir un parámetro ponderable, de 
entre otros, para una valoración final de diagnóstico. 


La ingeniería es clave en el desarrollo de las sociedades y por ello, 
es imprescindible dar cuenta de lo que genera y de lo que produce. En 
algunas sociedades de primer mundo existe una conciencia profunda 
de la importancia de la ingeniería en el contexto social, tanto así, que 
son las carreras más apetecidas por los estudiantes y las más requeridas 
por la industria y por la empresa en general. En Latinoamérica y en 
particular en el Ecuador, se presenta un fenómeno diferente, el número 
de estudiantes en los ámbitos de la ingeniería no es el más extenso ni 
tampoco constituyen las carreras más requeridas. Eso a la larga, nos 
lleva a ser más consumidores de la tecnología generada fuera y menos 
productivos a partir del conocimiento tecnológico. Será bueno, por 
ello, mirar más hacia la producción de tecnología, a la implicación de 
ella en la sociedad y difundir todo cuanto esté orientado a las aplica- 
ciones de la tecnología en la solución de problemas sociales. En ese 
contexto, en la obra quedan plasmadas las dos cosas, por una parte, 
la realidad vivida en el país debido a la COVID-19, exponiendo con 
ello una problemática social importante, y, por otra parte, una de las 
formas en como la ingeniería le ha plantado cara. 
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